Spaces:
Sleeping
Sleeping
Update helpers.py
Browse files- helpers.py +82 -14
helpers.py
CHANGED
@@ -381,31 +381,99 @@ def define_metadata(input_text):
|
|
381 |
'Định phí bảo hiểm và Quản trị rủi ro',
|
382 |
'Công nghệ thông tin',
|
383 |
'An toàn thông tin']
|
384 |
-
|
385 |
-
|
386 |
if condition3 in input_text:
|
387 |
result['Tai lieu ve'] = 'Đề cương'
|
388 |
elif condition1 in input_text:
|
389 |
result['Tai lieu ve'] = 'Chương trình đào tạo'
|
390 |
elif condition2 in input_text:
|
391 |
result['Tai lieu ve'] = 'Đề án'
|
392 |
-
|
393 |
-
|
|
|
|
|
|
|
|
|
|
|
394 |
if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
|
395 |
-
|
|
|
396 |
elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
|
397 |
-
|
398 |
if cond == 'Toán kinh tế':
|
399 |
-
|
400 |
elif cond == 'Phân tích dữ liệu trong Kinh tế':
|
401 |
-
|
402 |
elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
|
403 |
-
|
404 |
elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
|
405 |
-
|
|
|
406 |
elif cond == 'Thống kê kinh tế':
|
407 |
-
|
|
|
408 |
elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
|
409 |
-
|
410 |
-
|
411 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
381 |
'Định phí bảo hiểm và Quản trị rủi ro',
|
382 |
'Công nghệ thông tin',
|
383 |
'An toàn thông tin']
|
384 |
+
result = {}
|
385 |
+
# Xác định loại tài liệu
|
386 |
if condition3 in input_text:
|
387 |
result['Tai lieu ve'] = 'Đề cương'
|
388 |
elif condition1 in input_text:
|
389 |
result['Tai lieu ve'] = 'Chương trình đào tạo'
|
390 |
elif condition2 in input_text:
|
391 |
result['Tai lieu ve'] = 'Đề án'
|
392 |
+
|
393 |
+
# Nếu tài liệu là "Đề án", thêm tất cả các ngành và khoa theo mapping dưới đây.
|
394 |
+
if result.get('Tai lieu ve') == 'Đề án':
|
395 |
+
all_nganh = []
|
396 |
+
all_khoa = []
|
397 |
+
for cond in condition4:
|
398 |
+
# Xác định khoa dựa trên tên ngành
|
399 |
if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
|
400 |
+
khoa = 'Công nghệ thông tin (FIT)'
|
401 |
+
cond_value = cond
|
402 |
elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
|
403 |
+
khoa = 'Toán Kinh tế (MFE)'
|
404 |
if cond == 'Toán kinh tế':
|
405 |
+
cond_value = 'Toán kinh tế (TOKT)'
|
406 |
elif cond == 'Phân tích dữ liệu trong Kinh tế':
|
407 |
+
cond_value = 'Phân tích dữ liệu trong Kinh tế (DSEB)'
|
408 |
elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
|
409 |
+
cond_value = 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
|
410 |
elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
|
411 |
+
khoa = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
|
412 |
+
cond_value = cond
|
413 |
elif cond == 'Thống kê kinh tế':
|
414 |
+
khoa = 'Thống kê'
|
415 |
+
cond_value = cond
|
416 |
elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
|
417 |
+
khoa = 'Hệ thống thông tin quản lý (MIS)'
|
418 |
+
cond_value = cond
|
419 |
+
else:
|
420 |
+
khoa = None
|
421 |
+
cond_value = cond
|
422 |
+
all_nganh.append(cond_value)
|
423 |
+
if khoa is not None:
|
424 |
+
all_khoa.append(khoa)
|
425 |
+
result['Nganh'] = all_nganh
|
426 |
+
result['Khoa'] = all_khoa
|
427 |
+
else:
|
428 |
+
# Nếu không phải "Đề án", duyệt từng điều kiện trong condition4 dựa trên input_text
|
429 |
+
for cond in condition4:
|
430 |
+
if cond in input_text:
|
431 |
+
if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
|
432 |
+
result['Khoa'] = 'Công nghệ thông tin (FIT)'
|
433 |
+
result['Nganh'] = cond
|
434 |
+
elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
|
435 |
+
result['Khoa'] = 'Toán Kinh tế (MFE)'
|
436 |
+
if cond == 'Toán kinh tế':
|
437 |
+
result['Nganh'] = 'Toán kinh tế (TOKT)'
|
438 |
+
elif cond == 'Phân tích dữ liệu trong Kinh tế':
|
439 |
+
result['Nganh'] = 'Phân tích dữ liệu trong Kinh tế (DSEB)'
|
440 |
+
elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
|
441 |
+
result['Nganh'] = 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
|
442 |
+
elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
|
443 |
+
result['Khoa'] = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
|
444 |
+
result['Nganh'] = cond
|
445 |
+
elif cond == 'Thống kê kinh tế':
|
446 |
+
result['Khoa'] = 'Thống kê'
|
447 |
+
result['Nganh'] = cond
|
448 |
+
elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
|
449 |
+
result['Khoa'] = 'Hệ thống thông tin quản lý (MIS)'
|
450 |
+
result['Nganh'] = cond
|
451 |
+
return result
|
452 |
+
# #cond1 cond2 la str, con3 la list ten cac nganh
|
453 |
+
# result = {}
|
454 |
+
# if condition3 in input_text:
|
455 |
+
# result['Tai lieu ve'] = 'Đề cương'
|
456 |
+
# elif condition1 in input_text:
|
457 |
+
# result['Tai lieu ve'] = 'Chương trình đào tạo'
|
458 |
+
# elif condition2 in input_text:
|
459 |
+
# result['Tai lieu ve'] = 'Đề án'
|
460 |
+
# for cond in condition4:
|
461 |
+
# if cond in input_text:
|
462 |
+
# if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
|
463 |
+
# result['Khoa'] = 'Công nghệ thông tin (FIT)'
|
464 |
+
# elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
|
465 |
+
# result['Khoa'] = 'Toán Kinh tế (MFE)'
|
466 |
+
# if cond == 'Toán kinh tế':
|
467 |
+
# cond == 'Toán kinh tế (TOKT)'
|
468 |
+
# elif cond == 'Phân tích dữ liệu trong Kinh tế':
|
469 |
+
# cond == 'Phân tích dữ liệu trong Kinh tế (DSEB)'
|
470 |
+
# elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
|
471 |
+
# cond == 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
|
472 |
+
# elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
|
473 |
+
# result['Khoa'] = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
|
474 |
+
# elif cond == 'Thống kê kinh tế':
|
475 |
+
# result['Khoa'] = 'Thống kê'
|
476 |
+
# elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
|
477 |
+
# result['Khoa'] = 'Hệ thống thông tin quản lý (MIS)'
|
478 |
+
# result['Nganh'] = cond
|
479 |
+
# return result
|