quoc-khanh commited on
Commit
3d419e7
·
verified ·
1 Parent(s): b49f336

Update helpers.py

Browse files
Files changed (1) hide show
  1. helpers.py +82 -14
helpers.py CHANGED
@@ -381,31 +381,99 @@ def define_metadata(input_text):
381
  'Định phí bảo hiểm và Quản trị rủi ro',
382
  'Công nghệ thông tin',
383
  'An toàn thông tin']
384
- #cond1 cond2 la str, con3 la list ten cac nganh
385
- result = {}
386
  if condition3 in input_text:
387
  result['Tai lieu ve'] = 'Đề cương'
388
  elif condition1 in input_text:
389
  result['Tai lieu ve'] = 'Chương trình đào tạo'
390
  elif condition2 in input_text:
391
  result['Tai lieu ve'] = 'Đề án'
392
- for cond in condition4:
393
- if cond in input_text:
 
 
 
 
 
394
  if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
395
- result['Khoa'] = 'Công nghệ thông tin (FIT)'
 
396
  elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
397
- result['Khoa'] = 'Toán Kinh tế (MFE)'
398
  if cond == 'Toán kinh tế':
399
- cond == 'Toán kinh tế (TOKT)'
400
  elif cond == 'Phân tích dữ liệu trong Kinh tế':
401
- cond == 'Phân tích dữ liệu trong Kinh tế (DSEB)'
402
  elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
403
- cond == 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
404
  elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
405
- result['Khoa'] = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
 
406
  elif cond == 'Thống kê kinh tế':
407
- result['Khoa'] = 'Thống kê'
 
408
  elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
409
- result['Khoa'] = 'Hệ thống thông tin quản lý (MIS)'
410
- result['Nganh'] = cond
411
- return result
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
381
  'Định phí bảo hiểm và Quản trị rủi ro',
382
  'Công nghệ thông tin',
383
  'An toàn thông tin']
384
+ result = {}
385
+ # Xác định loại tài liệu
386
  if condition3 in input_text:
387
  result['Tai lieu ve'] = 'Đề cương'
388
  elif condition1 in input_text:
389
  result['Tai lieu ve'] = 'Chương trình đào tạo'
390
  elif condition2 in input_text:
391
  result['Tai lieu ve'] = 'Đề án'
392
+
393
+ # Nếu tài liệu là "Đề án", thêm tất cả các ngành và khoa theo mapping dưới đây.
394
+ if result.get('Tai lieu ve') == 'Đề án':
395
+ all_nganh = []
396
+ all_khoa = []
397
+ for cond in condition4:
398
+ # Xác định khoa dựa trên tên ngành
399
  if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
400
+ khoa = 'Công nghệ thông tin (FIT)'
401
+ cond_value = cond
402
  elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
403
+ khoa = 'Toán Kinh tế (MFE)'
404
  if cond == 'Toán kinh tế':
405
+ cond_value = 'Toán kinh tế (TOKT)'
406
  elif cond == 'Phân tích dữ liệu trong Kinh tế':
407
+ cond_value = 'Phân tích dữ liệu trong Kinh tế (DSEB)'
408
  elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
409
+ cond_value = 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
410
  elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
411
+ khoa = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
412
+ cond_value = cond
413
  elif cond == 'Thống kê kinh tế':
414
+ khoa = 'Thống kê'
415
+ cond_value = cond
416
  elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
417
+ khoa = 'Hệ thống thông tin quản lý (MIS)'
418
+ cond_value = cond
419
+ else:
420
+ khoa = None
421
+ cond_value = cond
422
+ all_nganh.append(cond_value)
423
+ if khoa is not None:
424
+ all_khoa.append(khoa)
425
+ result['Nganh'] = all_nganh
426
+ result['Khoa'] = all_khoa
427
+ else:
428
+ # Nếu không phải "Đề án", duyệt từng điều kiện trong condition4 dựa trên input_text
429
+ for cond in condition4:
430
+ if cond in input_text:
431
+ if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
432
+ result['Khoa'] = 'Công nghệ thông tin (FIT)'
433
+ result['Nganh'] = cond
434
+ elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
435
+ result['Khoa'] = 'Toán Kinh tế (MFE)'
436
+ if cond == 'Toán kinh tế':
437
+ result['Nganh'] = 'Toán kinh tế (TOKT)'
438
+ elif cond == 'Phân tích dữ liệu trong Kinh tế':
439
+ result['Nganh'] = 'Phân tích dữ liệu trong Kinh tế (DSEB)'
440
+ elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
441
+ result['Nganh'] = 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
442
+ elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
443
+ result['Khoa'] = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
444
+ result['Nganh'] = cond
445
+ elif cond == 'Thống kê kinh tế':
446
+ result['Khoa'] = 'Thống kê'
447
+ result['Nganh'] = cond
448
+ elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
449
+ result['Khoa'] = 'Hệ thống thông tin quản lý (MIS)'
450
+ result['Nganh'] = cond
451
+ return result
452
+ # #cond1 cond2 la str, con3 la list ten cac nganh
453
+ # result = {}
454
+ # if condition3 in input_text:
455
+ # result['Tai lieu ve'] = 'Đề cương'
456
+ # elif condition1 in input_text:
457
+ # result['Tai lieu ve'] = 'Chương trình đào tạo'
458
+ # elif condition2 in input_text:
459
+ # result['Tai lieu ve'] = 'Đề án'
460
+ # for cond in condition4:
461
+ # if cond in input_text:
462
+ # if cond in ['An toàn thông tin', 'Công nghệ thông tin', 'Khoa học máy tính', 'Kỹ thuật phần mềm']:
463
+ # result['Khoa'] = 'Công nghệ thông tin (FIT)'
464
+ # elif cond in ['Toán kinh tế', 'Phân tích dữ liệu trong Kinh tế', 'Định phí bảo hiểm và Quản trị rủi ro']:
465
+ # result['Khoa'] = 'Toán Kinh tế (MFE)'
466
+ # if cond == 'Toán kinh tế':
467
+ # cond == 'Toán kinh tế (TOKT)'
468
+ # elif cond == 'Phân tích dữ liệu trong Kinh tế':
469
+ # cond == 'Phân tích dữ liệu trong Kinh tế (DSEB)'
470
+ # elif cond == 'Định phí bảo hiểm và Quản trị rủi ro':
471
+ # cond == 'Định phí bảo hiểm và Quản trị rủi ro (Actuary)'
472
+ # elif cond in ['Khoa học dữ liệu', 'Trí tuệ nhân tạo']:
473
+ # result['Khoa'] = 'Khoa học dữ liệu và Trí tuệ nhân tạo (FDA)'
474
+ # elif cond == 'Thống kê kinh tế':
475
+ # result['Khoa'] = 'Thống kê'
476
+ # elif cond in ['Hệ thống thông tin', 'Hệ thống thông tin quản lý']:
477
+ # result['Khoa'] = 'Hệ thống thông tin quản lý (MIS)'
478
+ # result['Nganh'] = cond
479
+ # return result