dejaun's picture
Upload finetuned model
e8d8bd7 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:651725
  - loss:SoftmaxLoss
base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
widget:
  - source_sentence: Nguyên tắc áp dụng phụ cấp ưu đãi nghề y tế thế nào?
    sentences:
      - >-
        Chu kỳ kiểm định chất lượng giáo dục nghề nghiệp\n...\n2. Trường hợp cơ
        sở giáo dục nghề nghiệp có ngành, nghề trọng điểm; chương trình đào tạo
        ngành, nghề trọng điểm; cơ sở giáo dục nghề nghiệp và chương trình đào
        tạo các ngành, nghề phục vụ yêu cầu công tác quản lý nhà nước phải thực
        hiện kiểm định chất lượng giáo dục nghề nghiệp theo quy định tại điểm d
        khoản 3 Điều 65 của Luật Giáo dục nghề nghiệp số 74/2014/QH13 ngày 27
        tháng 11 năm 2014 nhưng không đạt tiêu chuẩn kiểm định chất lượng giáo
        dục nghề nghiệp thì trong thời hạn 03 năm phải thực hiện kiểm định lại.
      - >-
        Vệ sinh môi trường, vệ sinh tòa nhà\n1. Trách nhiệm của các đơn vị, cán
        bộ, công chức, viên chức, nhân viên và người lao động trong việc giữ gìn
        vệ sinh tại nơi làm việc và khu vực công cộng:\na) Hàng ngày tự vệ sinh
        sàn nhà, bàn ghế, tủ, các thiết bị được trang cấp và tổng vệ sinh phòng
        làm việc vào chiều thứ Sáu hàng tuần;\nb) Có trách nhiệm thu gom rác
        thải trong phòng chuyển ra thùng rác đặt tại các hành lang;\nc) Không đổ
        nước chè, cà phê, ….. xuống sàn nhà, hành lang, tường nhà và khu vệ
        sinh;\nd) Nghiêm cấp hút thuốc lá trong phòng làm việc, phòng họp, cầu
        thang máy, cầu thang bộ, tầng hầm;\nđ) Không khạc nhổ, bôi bẩn lên
        tường, không vứt rác thải, gạt tàn thuốc lá, đầu lọc thuốc lá xuống sàn
        nhà và các khu vực công cộng;\ne) Nghiêm cấm hái hoa, bẻ cành, dẫm lên
        thảm cỏ, nhổ cây trong khuôn viên cơ quan.\ng) Nghiêm cấm mang chất độc
        hại vào cơ quan.\n…
      - >-
        Nguyên tắc áp dụng\n1. Trường hợp công chức, viên chức chuyên môn y tế
        thuộc đối tượng được hưởng các mức phụ cấp ưu đãi theo nghề khác nhau
        thì được hưởng một mức phụ cấp ưu đãi theo nghề cao nhất.\n2. Công chức,
        viên chức đã hưởng phụ cấp ưu đãi theo nghề quy định tại Thông tư liên
        tịch số 06/2010/TTLT-BYT-BNV-BTC ngày 22/3/2010 của Bộ Y tế, Bộ Nội vụ,
        Bộ Tài chính hướng dẫn thực hiện Nghị định số 64/2009/NĐ-CP ngày
        30/7/2009 của Chính phủ về chính sách đối với cán bộ, viên chức y tế
        công tác ở vùng có điều kiện kinh tế - xã hội đặc biệt khó khăn thì
        không hưởng phụ cấp ưu đãi theo nghề quy định tại Thông tư liên tịch
        này.
  - source_sentence: Số lượng thành viên Hội đồng khoa học  đào tạo  bao nhiêu?
    sentences:
      - >-
        Cấp Giấy chứng nhận chất lượng an toàn kỹ thuật và bảo vệ môi trường
        trong sản xuất, lắp ráp ô tô, rơ moóc và sơ mi rơ moóc\n2.1. Trình tự
        thực hiện:\na) Nộp hồ sơ TTHC:\n- Cơ sở sản xuất lập hồ sơ kiểm tra xe
        cơ giới theo quy định và nộp đến Cục Đăng kiểm Việt Nam.\nb) Giải quyết
        TTHC:\n- Cục Đăng kiểm Việt Nam tiếp nhận và kiểm tra thành phần hồ sơ
        kiểm tra xe cơ giới: nếu hồ sơ không đầy đủ theo quy định thì hướng dẫn
        Cơ sở sản xuất hoàn thiện lại; Nếu hồ sơ đầy đủ theo quy định thì thống
        nhất về thời gian và địa điểm thực hiện đánh giá điều kiện kiểm tra chất
        lượng sản phẩm tại Cơ sở sản xuất;\n- Cục Đăng kiểm Việt Nam tiến hành
        kiểm tra nội dung hồ sơ và thực hiện đánh giá điều kiện kiểm tra chất
        lượng sản phẩm tại Cơ sở sản xuất theo quy định: Nếu chưa đạt yêu cầu
        thì thông báo để Cơ sở sản xuất hoàn thiện lại; Nếu đạt yêu cầu thì cấp
        Giấy chứng nhận trong thời hạn 03 ngày làm việc kể từ ngày kết thúc kiểm
        tra, đánh giá hồ sơ đầy đủ, hợp lệ theo quy định và có kết quả đánh giá
        COP đạt yêu cầu;\n- Cơ sở sản xuất nộp hồ sơ kiểm tra xe cơ giới và nhận
        kết quả trực tiếp tại trụ sở Cục Đăng kiểm Việt Nam hoặc qua hệ thống
        bưu chính hoặc qua hệ thống dịch vụ công trực tuyến hoặc qua hình thức
        phù hợp khác.\n...
      - >-
        Phiên họp Hội đồng khoa học\n1. Hội đồng khoa học họp định kỳ 06
        tháng/01 lần. Các phiên họp định kỳ phải có ít nhất 2/3 tổng số thành
        viên của Hội đồng khoa học tham dự.\n2. Phiên họp đột xuất của Hội đồng
        khoa học được triệu tập theo quyết định của Chủ tịch và phải có trên 1/2
        số thành viên của Hội đồng khoa học tham dự.\n3. Viện trưởng VKSND tối
        cao tham dự phiên họp của Hội đồng khoa học khi thấy cần thiết.\n4. Tùy
        thuộc vào nội dung chương trình phiên họp, Chủ tịch Hội đồng khoa học có
        thể quyết định mời các nhà khoa học trong và ngoài ngành KSND tham gia
        phiên họp.\n5. Nội dung phiên họp, các tài liệu liên quan đến phiên họp
        của Hội đồng khoa học phải được thông báo hoặc chuyển cho các Thành viên
        chậm nhất là 3 ngày làm việc trước ngày họp, trừ trường hợp đột
        xuất.\n6. Hội đồng khoa học thảo luận dân chủ, tập thể, công khai, quyết
        định theo đa số về những vấn đề thuộc nội dung phiên họp và những vấn đề
        do Chủ tịch Hội đồng khoa học nêu ra hoặc do các Thành viên đề nghị và
        được Chủ tịch Hội đồng khoa học chấp thuận.\nChủ tịch Hội đồng khoa học
        chủ trì thảo luận và kết luận tại phiên họp. Đối với những vấn đề phức
        tạp còn nhiều ý kiến khác nhau, Hội đồng khoa học tiến hành biểu quyết.
        Những vấn đề được biểu quyết đạt trên 2/3 số phiếu của thành viên có mặt
        hoặc trên 50% tổng số thành viên Hội đồng được coi là ý kiến chính thức
        của Hội đồng khoa học. Các ý kiến khác được bảo lưu, ghi vào biên bản
        cuộc họp.
      - >-
        Hồ sơ, thủ tục công nhận liệt sĩ\n1. Người khi hy sinh đang thuộc quân
        đội, công an quản lý thì Bộ Quốc phòng, Bộ Công an chịu trách nhiệm:\na)
        Hướng dẫn về quy trình lập hồ sơ đề nghị công nhận liệt sĩ theo quy
        định.\nb) Có văn bản đề nghị kèm hồ sơ gửi Bộ Lao động - Thương binh và
        Xã hội thẩm định trong thời gian không quá 50 ngày kể từ ngày cơ quan,
        đơn vị trực tiếp quản lý người hy sinh xác lập, hoàn thiện các giấy tờ
        quy định tại Điều 17 Nghị định này.
  - source_sentence: Ban Tài chính Văn phòng Kiểm toán nhà nước thực hiện những chức năng gì?
    sentences:
      - >-
        Tiếp nhận hồ sơ và trả kết quả\n...\n2.2.4. Lao động nam hoặc người
        chồng của lao động nữ mang thai hộ nghỉ việc khi vợ sinh con: Bản sao
        giấy chứng sinh hoặc bản sao giấy khai sinh hoặc trích lục khai sinh của
        con; trường hợp sinh con phải phẫu thuật hoặc sinh con dưới 32 tuần tuổi
        mà giấy chứng sinh không thể hiện thì có thêm giấy tờ của cơ sở khám
        bệnh, chữa bệnh thể hiện việc sinh con phải phẫu thuật, sinh con dưới 32
        tuần tuổi. Trường hợp con chết sau khi sinh mà chưa được cấp giấy chứng
        sinh thì thay bằng trích sao hoặc tóm tắt hồ sơ bệnh án hoặc giấy ra
        viện của người mẹ hoặc của lao động nữ mang thai hộ thể hiện con chết…
      - >-
        Việc tự giám sát chất lượng dịch vụ viễn thông của doanh nghiệp viễn
        thông\n1. Các doanh nghiệp viễn thông được Bộ Thông tin và Truyền thông
        cấp giấy phép kinh doanh dịch vụ viễn thông phải thường xuyên tự giám
        sát chất lượng dịch vụ đối với tất cả các dịch vụ thuộc “Danh mục dịch
        vụ viễn thông bắt buộc quản lý chất lượng” mà mình cung cấp.\n2. Trong
        trường hợp dịch vụ mà mình cung cấp có sự cố thì doanh nghiệp viễn thông
        phải thực hiện báo cáo đột xuất như quy định tại Khoản 3 Điều 8 của
        Thông tư này.
      - >-
        Cục Quản lý, giám sát bảo hiểm; Cục Quản lý Công sản; Cục Quản lý Giá;
        Cục Quản lý Nợ và Tài chính đối ngoại; Cục Quản lý, giám sát Kế toán,
        Kiểm toán; Cục Quản lý Công sản; Cục Tài chính doanh nghiệp và Vụ Tài
        chính ngân hàng chủ trì phối hợp với Cục Tin học & Thống kê Tài chính
        xây dựng quy trình điện tử từng thủ tục hành chính theo phạm vi quản lý
        đối với danh mục thủ tục hành chính để thực hiện tích hợp trên Hệ thống
        thông tin Một cửa điện tử của Bộ Tài chính.
  - source_sentence: >-
      Điều kiện để Giám đốc Học viện An ninh nhân dân được thăng cấp bậc hàm
      trước thời hạn như thế nào?
    sentences:
      - >-
        Mức độ tự chủ và trách nhiệm\n- Có ý thức và tác phong nghề nghiệp đúng
        chuẩn mực, có năng lực thực hiện công việc được giao; phương pháp làm
        việc khoa học, biết phân tích và giải quyết các vấn đề mới về lĩnh vực
        chuyên môn nghề;\n- Gắn bó nghề nghiệp; nghiêm chỉnh chấp hành quy chế,
        quy định của cơ quan, doanh nghiệp, nơi đang công tác với ý thức tổ
        chức kỉ luật và tinh thần trách nhiệm cao trong công việc;\n- Lập được
        các biện pháp an toàn và đảm bảo an toàn, vệ sinh lao động trong quá
        trình làm việc; có ý thức trách nhiệm công dân, thái độ và đạo đức nghề
        nghiệp đúng đắn, sẵn sàng nhận nhiệm vụ; tự tin, cầu tiến trong công
        việc; hợp tác, thân thiện, khiêm tốn trong các mối quan hệ;\n- Tự chịu
        trách nhiệm về chất lượng đối với kết quả công việc, sản phẩm do mình
        đảm nhiệm theo các tiêu chuẩn và chịu một phần trách nhiệm đối với kết
        quả công việc, sản phẩm của tổ, nhóm;
      - >-
        Tổ chức bộ máy\n...\n5. Tổng cục Hải quan có thể biệt phái công chức từ
        các đơn vị thuộc và trực thuộc Tổng cục để bổ sung cán bộ chủ chốt, cán
        bộ kỹ thuật có năng lực, kinh nghiệm cho Ban Quản lý dự án đầu tư xây
        dựng chuyên ngành của Tổng cục Hải quan. Thời hạn biệt phái các công
        chức không quá 03 năm, trường hợp quá 03 năm mà chưa hoàn thành dự án
        thì Tổng cục Hải quan xem xét quyết định bổ sung thời gian biệt
        phái.\nNhân sự tuyển dụng mới của Ban Quản lý dự án đầu tư xây dựng
        chuyên ngành của Tổng cục Hải quan là viên chức hoặc hợp đồng lao động,
        thực hiện theo quy định về chế độ tiền lương và các chế độ, chính sách
        đối với viên chức và người lao động.\n...
      - >-
        Biệt phái công chức\n...\n6. Không thực hiện biệt phái công chức nữ đang
        mang thai hoặc nuôi con dưới 36 tháng tuổi.
  - source_sentence: >-
      Thời điểm đánh giá và xếp loại chất lượng hằng năm của công chức, viên
      chức thuộc Bộ Tài chính được diễn ra trong thời gian nào?
    sentences:
      - >-
        Nhiệm vụ của giáo viên\n1. Thực hiện nhiệm vụ tổ chức các hoạt động dạy
        học, giáo dục theo kế hoạch giáo dục của nhà trường và kế hoạch giáo dục
        của tổ chuyên môn; quản lý học sinh trong các hoạt động giáo dục do nhà
        trường tổ chức; tham gia các hoạt động chuyên môn; chịu trách nhiệm về
        chất lượng, hiệu quả giáo dục.\n2. Trau dồi đạo đức, nêu cao tinh thần
        trách nhiệm, giữ gìn phẩm chất, danh dự, uy tín của nhà giáo; gương mẫu
        trước học sinh; thương yêu, đối xử công bằng và tôn trọng nhân cách của
        học sinh; bảo vệ các quyền và lợi ích chính đáng của học sinh; đoàn kết,
        giúp đỡ đồng nghiệp.\n3. Học tập, rèn luyện để nâng cao sức khỏe, trình
        độ chính trị, chuyên môn, nghiệp vụ, đổi mới phương pháp dạy học, giáo
        dục.\n4. Tham gia tập huấn, bồi dưỡng chuyên môn, nghiệp vụ.\n5. Tham
        gia công tác phổ cập giáo dục trung học cơ sở ở địa phương.\n6. Thực
        hiện nghĩa vụ công dân, các quy định của pháp luật và của ngành Giáo
        dục, các quyết định của hiệu trưởng; thực hiện nhiệm vụ do hiệu trưởng
        phân công, chịu sự kiểm tra, đánh giá của hiệu trưởng và các cấp quản lý
        giáo dục.\n7. Phối hợp với Đội Thiếu niên Tiền phong Hồ Chí Minh, Đoàn
        Thanh niên Cộng sản Hồ Chí Minh, Hội Liên hiệp Thanh niên Việt Nam, gia
        đình học sinh và các tổ chức xã hội liên quan để tổ chức hoạt động giáo
        dục.\n8. Thực hiện các nhiệm vụ khác theo quy định của pháp luật.
      - >-
        “Điều 1. Danh mục trang thiết bị y tế phục vụ phòng, chống dịch COVID-19
        trong trường hợp cấp bách theo quy định tại khoản 3 Điều 29 Nghị định số
        98/2021/NĐ-CP ngày 08 tháng 11 năm 2021 của Chính phủ về quản lý trang
        thiết bị y tế \n1. Máy PCR. \n2. Hóa chất (sinh phẩm) chạy máy PCR xét
        nghiệm SARS-CoV-2. \n3. Test kít xét nghiệm nhanh kháng nguyên/ kháng
        thể kháng SARS-CoV-2. \n4. Máy thở chức năng cao, máy thở xâm nhập và
        không xâm nhập, máy thở không xâm nhập, máy oxy dòng cao, máy thở xách
        tay. \n5. Máy lọc máu liên tục. \n6. Máy X-Quang di động. \n7. Máy đo
        khí máu (đo được điện giải, lactat, hematocrite). \n8. Máy theo dõi bệnh
        nhân>5 thông số. \n9. Bơm tiêm điện; Bơm truyền dịch. \n10. Máy phá rung
        tim có tạo nhịp. \n11. Máy đo thời gian đông máu. \n12. Máy đo huyết
        động.”
      - >-
        Thời điểm đánh giá xếp loại chất lượng hằng năm\n...\n2. Căn cứ tình
        hình thực tiễn của cơ quan, tổ chức, đơn vị, tập thể lãnh đạo cơ quan,
        tổ chức, đơn vị thống nhất với cấp ủy cùng cấp về việc kết hợp tổ chức
        cuộc họp đánh giá, xếp loại chất lượng công chức, viên chức và xếp loại
        đảng viên trong tổ chức, đơn vị mình, bảo đảm nghiêm túc, hiệu quả,
        tránh hình thức, lãng phí.\n3. Tại thời điểm đánh giá, xếp loại chất
        lượng, trường hợp vắng mặt có lý do chính đáng hoặc nghỉ ốm, nghỉ chế độ
        thai sản theo quy định của pháp luật, công chức, viên chức có trách
        nhiệm làm báo cáo tại Phiếu đánh giá, xếp loại chất lượng theo chức
        trách, nhiệm vụ được giao, gửi cơ quan, tổ chức, đơn vị đang công tác để
        thực hiện việc đánh giá, xếp loại chất lượng theo quy định của pháp luật
        và Quy chế này.
pipeline_tag: sentence-similarity
library_name: sentence-transformers

SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("legalvn/paraphrase-multilingual-MiniLM-L12-v2-166000")
# Run inference
sentences = [
    'Thời điểm đánh giá và xếp loại chất lượng hằng năm của công chức, viên chức thuộc Bộ Tài chính được diễn ra trong thời gian nào?',
    'Thời điểm đánh giá xếp loại chất lượng hằng năm\\n...\\n2. Căn cứ tình hình thực tiễn của cơ quan, tổ chức, đơn vị, tập thể lãnh đạo cơ quan, tổ chức, đơn vị thống nhất với cấp ủy cùng cấp về việc kết hợp tổ chức cuộc họp đánh giá, xếp loại chất lượng công chức, viên chức và xếp loại đảng viên trong tổ chức, đơn vị mình, bảo đảm nghiêm túc, hiệu quả, tránh hình thức, lãng phí.\\n3. Tại thời điểm đánh giá, xếp loại chất lượng, trường hợp vắng mặt có lý do chính đáng hoặc nghỉ ốm, nghỉ chế độ thai sản theo quy định của pháp luật, công chức, viên chức có trách nhiệm làm báo cáo tại Phiếu đánh giá, xếp loại chất lượng theo chức trách, nhiệm vụ được giao, gửi cơ quan, tổ chức, đơn vị đang công tác để thực hiện việc đánh giá, xếp loại chất lượng theo quy định của pháp luật và Quy chế này.',
    '“Điều 1. Danh mục trang thiết bị y tế phục vụ phòng, chống dịch COVID-19 trong trường hợp cấp bách theo quy định tại khoản 3 Điều 29 Nghị định số 98/2021/NĐ-CP ngày 08 tháng 11 năm 2021 của Chính phủ về quản lý trang thiết bị y tế \\n1. Máy PCR. \\n2. Hóa chất (sinh phẩm) chạy máy PCR xét nghiệm SARS-CoV-2. \\n3. Test kít xét nghiệm nhanh kháng nguyên/ kháng thể kháng SARS-CoV-2. \\n4. Máy thở chức năng cao, máy thở xâm nhập và không xâm nhập, máy thở không xâm nhập, máy oxy dòng cao, máy thở xách tay. \\n5. Máy lọc máu liên tục. \\n6. Máy X-Quang di động. \\n7. Máy đo khí máu (đo được điện giải, lactat, hematocrite). \\n8. Máy theo dõi bệnh nhân>5 thông số. \\n9. Bơm tiêm điện; Bơm truyền dịch. \\n10. Máy phá rung tim có tạo nhịp. \\n11. Máy đo thời gian đông máu. \\n12. Máy đo huyết động.”',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 651,725 training samples
  • Columns: queries, corpus, and score
  • Approximate statistics based on the first 1000 samples:
    queries corpus score
    type string string int
    details
    • min: 9 tokens
    • mean: 24.71 tokens
    • max: 43 tokens
    • min: 29 tokens
    • mean: 121.6 tokens
    • max: 128 tokens
    • 0: ~43.80%
    • 1: ~37.00%
    • 2: ~19.20%
  • Samples:
    queries corpus score
    Người học ngành quản lý khai thác công trình thủy lợi trình độ cao đẳng phải có khả năng học tập và nâng cao trình độ như thế nào? Khả năng học tập, nâng cao trình độ\n- Khối lượng khối lượng kiến thức tối thiểu, yêu cầu về năng lực mà người học phải đạt được sau khi tốt nghiệp ngành, nghề Dược trình độ cao đẳng có thể tiếp tục phát triển ở các trình độ cao hơn;\n- Người học sau tốt nghiệp có năng lực tự học, tự cập nhật những tiến bộ khoa học công nghệ trong phạm vi ngành, nghề để nâng cao trình độ hoặc học liên thông lên trình độ cao hơn trong cùng ngành nghề hoặc trong nhóm ngành, nghề hoặc trong cùng lĩnh vực đào tạo. 2
    Nội dung lồng ghép vấn đề bình đẳng giới trong xây dựng văn bản quy phạm pháp luật được quy định thế nào? Nội dung lồng ghép vấn đề bình đẳng giới trong xây dựng văn bản quy phạm pháp luật\nTrong phạm vi điều chỉnh của văn bản quy phạm pháp luật:\n1. Xác định nội dung liên quan đến vấn đề bình đẳng giới hoặc vấn đề bất bình đẳng giới, phân biệt đối xử về giới.\n2. Quy định các biện pháp cần thiết để thực hiện bình đẳng giới hoặc để giải quyết vấn đề bất bình đẳng giới, phân biệt đối xử về giới; dự báo tác động của các quy định đó đối với nam và nữ sau khi được ban hành.\n3. Xác định nguồn nhân lực, tài chính cần thiết để triển khai các biện pháp thực hiện bình đẳng giới hoặc để giải quyết vấn đề bất bình đẳng giới, phân biệt đối xử về giới. 2
    Nội dung lồng ghép vấn đề bình đẳng giới trong xây dựng văn bản quy phạm pháp luật được quy định thế nào? Mục đích lồng ghép vấn đề bình đẳng giới trong xây dựng văn bản quy phạm pháp luật\nLồng ghép vấn đề bình đẳng giới trong xây dựng văn bản quy phạm pháp luật (sau đây gọi tắt là văn bản) là một biện pháp để thực hiện mục tiêu bình đẳng giới, xóa bỏ phân biệt đối xử về giới, bảo đảm quyền, lợi ích hợp pháp, phù hợp với đặc thù của mỗi giới; tạo cơ hội phát triển như nhau cho nam và nữ trong các lĩnh vực của đời sống xã hội và gia đình; bảo đảm bình đẳng giới thực chất giữa nam và nữ. 1
  • Loss: SoftmaxLoss

Training Hyperparameters

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 8
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3.0
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss
0.0061 500 1.0473
0.0123 1000 1.0447
0.0184 1500 1.0383
0.0246 2000 1.0395
0.0307 2500 1.0436
0.0368 3000 1.0375
0.0430 3500 1.0189
0.0491 4000 1.0282
0.0552 4500 1.0355
0.0614 5000 1.0286
0.0675 5500 1.0264
0.0737 6000 1.0174
0.0798 6500 1.0238
0.0859 7000 1.0217
0.0921 7500 1.0203
0.0982 8000 1.0201
0.1043 8500 1.0266
0.1105 9000 1.0379
0.1166 9500 1.0367
0.1228 10000 1.0384
0.1289 10500 1.0291
0.1350 11000 1.0362
0.1412 11500 1.0354
0.1473 12000 1.0204
0.1534 12500 1.0401
0.1596 13000 1.0237
0.1657 13500 1.0271
0.1719 14000 1.0235
0.1780 14500 1.0329
0.1841 15000 1.0474
0.1903 15500 1.0547
0.1964 16000 1.0557
0.2025 16500 1.0626
0.2087 17000 1.0551
0.2148 17500 1.0526
0.2210 18000 1.125
0.2271 18500 1.2996
0.2332 19000 1.0703
0.2394 19500 1.0601
0.2455 20000 1.0835
0.2516 20500 1.0583
0.2578 21000 1.141
0.2639 21500 1.0802
0.2701 22000 1.0589
0.2762 22500 1.086
0.2823 23000 1.0743
0.2885 23500 1.0605
0.2946 24000 1.0602
0.3007 24500 1.0732
0.3069 25000 1.0614
0.3130 25500 1.0666
0.3192 26000 1.0669
0.3253 26500 1.0627
0.3314 27000 1.0659
0.3376 27500 1.07
0.3437 28000 1.0783
0.3498 28500 1.078
0.3560 29000 1.0832
0.3621 29500 1.0695
0.3683 30000 1.0714
0.3744 30500 1.3794
0.3805 31000 1.0838
0.3867 31500 1.0541
0.3928 32000 1.0799
0.3989 32500 1.0622
0.4051 33000 1.0597
0.4112 33500 1.0731
0.4174 34000 1.0871
0.4235 34500 1.0535
0.4296 35000 1.3215
0.4358 35500 1.1501
0.4419 36000 1.1088
0.4480 36500 1.0844
0.4542 37000 1.0981
0.4603 37500 1.0856
0.4665 38000 1.0956
0.4726 38500 1.0813
0.4787 39000 1.0843
0.4849 39500 1.1053
0.4910 40000 1.092
0.4971 40500 1.081
0.5033 41000 1.0919
0.5094 41500 1.0681
0.5156 42000 1.0826
0.5217 42500 1.0809
0.5278 43000 1.093
0.5340 43500 1.0709
0.5401 44000 1.0623
0.5462 44500 1.0801
0.5524 45000 1.0833
0.5585 45500 1.0816
0.5647 46000 1.0697
0.5708 46500 1.0864
0.5769 47000 1.0744
0.5831 47500 1.0897
0.5892 48000 1.0727
0.5953 48500 1.0621
0.6015 49000 1.0582
0.6076 49500 1.0681
0.6138 50000 1.083
0.6199 50500 1.0632
0.6260 51000 1.0809
0.6322 51500 1.0525
0.6383 52000 1.6649
0.6444 52500 1.0873
0.6506 53000 1.0649
0.6567 53500 1.0591
0.6629 54000 1.061
0.6690 54500 1.0682
0.6751 55000 1.0616
0.6813 55500 1.0827
0.6874 56000 1.0799
0.6935 56500 1.0705
0.6997 57000 1.0821
0.7058 57500 1.0763
0.7120 58000 1.0842
0.7181 58500 1.0813
0.7242 59000 1.0678
0.7304 59500 1.0894
0.7365 60000 1.0733
0.7426 60500 1.0688
0.7488 61000 1.0665
0.7549 61500 1.0681
0.7611 62000 1.301
0.7672 62500 1.0907
0.7733 63000 1.3941
0.7795 63500 1.1355
0.7856 64000 1.2196
0.7917 64500 1.225
0.7979 65000 1.1437
0.8040 65500 1.0787
0.8102 66000 1.0686
0.8163 66500 1.1017
0.8224 67000 1.0999
0.8286 67500 1.0771
0.8347 68000 1.1015
0.8408 68500 1.0826
0.8470 69000 1.1046
0.8531 69500 1.0735
0.8593 70000 1.1056
0.8654 70500 1.1077
0.8715 71000 1.0897
0.8777 71500 1.0775
0.8838 72000 1.0907
0.8899 72500 1.0705
0.8961 73000 1.0776
0.9022 73500 1.0896
0.9084 74000 1.0889
0.9145 74500 1.0804
0.9206 75000 1.1087
0.9268 75500 1.0738
0.9329 76000 1.0806
0.9390 76500 1.0899
0.9452 77000 1.0814
0.9513 77500 1.0723
0.9575 78000 1.0923
0.9636 78500 1.0748
0.9697 79000 1.0745
0.9759 79500 1.081
0.9820 80000 1.08
0.9881 80500 1.0905
0.9943 81000 1.1064
1.0004 81500 1.0929
1.0066 82000 1.0815
1.0127 82500 1.0768
1.0188 83000 1.1004
1.0250 83500 1.0835
1.0311 84000 1.0765
1.0372 84500 1.0906
1.0434 85000 1.096
1.0495 85500 1.1085
1.0557 86000 1.0913
1.0618 86500 1.0974
1.0679 87000 1.0763
1.0741 87500 1.0894
1.0802 88000 1.1065
1.0863 88500 1.0898
1.0925 89000 1.1036
1.0986 89500 1.0825
1.1048 90000 1.1164
1.1109 90500 1.0811
1.1170 91000 1.115
1.1232 91500 1.1123
1.1293 92000 1.0846
1.1354 92500 1.0917
1.1416 93000 1.0879
1.1477 93500 1.0969
1.1539 94000 1.0849
1.1600 94500 1.0852
1.1661 95000 1.0774
1.1723 95500 1.0984
1.1784 96000 1.0936
1.1845 96500 1.0842
1.1907 97000 1.0895
1.1968 97500 1.09
1.2030 98000 1.0813
1.2091 98500 1.0965
1.2152 99000 1.1017
1.2214 99500 1.1045
1.2275 100000 1.093
1.2336 100500 1.0903
1.2398 101000 1.1133
1.2459 101500 1.0883
1.2521 102000 1.1192
1.2582 102500 1.0817
1.2643 103000 1.0822
1.2705 103500 1.0915
1.2766 104000 1.1128
1.2827 104500 1.0786
1.2889 105000 1.1101
1.2950 105500 1.097
1.3012 106000 1.095
1.3073 106500 1.0884
1.3134 107000 1.09
1.3196 107500 1.1057
1.3257 108000 1.087
1.3318 108500 1.1009
1.3380 109000 1.0849
1.3441 109500 1.0886
1.3503 110000 1.0805
1.3564 110500 1.0808
1.3625 111000 1.1025
1.3687 111500 1.0955
1.3748 112000 1.0824
1.3809 112500 1.0835
1.3871 113000 1.1168
1.3932 113500 1.0881
1.3994 114000 1.0946
1.4055 114500 1.0819
1.4116 115000 1.1155
1.4178 115500 1.1021
1.4239 116000 1.102
1.4300 116500 1.0733
1.4362 117000 1.0987
1.4423 117500 1.1103
1.4485 118000 1.1034
1.4546 118500 1.0987
1.4607 119000 1.0908
1.4669 119500 1.0986
1.4730 120000 1.0988
1.4791 120500 1.1023
1.4853 121000 1.1013
1.4914 121500 1.0896
1.4976 122000 1.8455
1.5037 122500 1.1155
1.5098 123000 1.1502
1.5160 123500 1.1183
1.5221 124000 1.0958
1.5282 124500 1.1098
1.5344 125000 1.1021
1.5405 125500 1.0912
1.5467 126000 1.0961
1.5528 126500 1.0858
1.5589 127000 1.0784
1.5651 127500 1.1112
1.5712 128000 1.1067
1.5773 128500 1.0986
1.5835 129000 1.0824
1.5896 129500 1.1072
1.5958 130000 1.1098
1.6019 130500 1.0962
1.6080 131000 1.1108
1.6142 131500 1.1187
1.6203 132000 1.0923
1.6264 132500 1.1003
1.6326 133000 1.0865
1.6387 133500 1.099
1.6449 134000 1.0838
1.6510 134500 1.0792
1.6571 135000 1.0966
1.6633 135500 1.0782
1.6694 136000 1.1123
1.6755 136500 1.0923
1.6817 137000 1.0873
1.6878 137500 1.0807
1.6940 138000 1.083
1.7001 138500 1.0864
1.7062 139000 1.0828
1.7124 139500 1.0973
1.7185 140000 1.1022
1.7246 140500 1.0837
1.7308 141000 1.0985
1.7369 141500 1.1049
1.7431 142000 1.079
1.7492 142500 1.0757
1.7553 143000 1.0808
1.7615 143500 1.0743
1.7676 144000 1.0933
1.7737 144500 1.0938
1.7799 145000 1.1121
1.7860 145500 1.1138
1.7922 146000 1.1063
1.7983 146500 1.097
1.8044 147000 1.0999
1.8106 147500 1.1035
1.8167 148000 1.0786
1.8228 148500 1.0824
1.8290 149000 1.1097
1.8351 149500 1.0744
1.8413 150000 1.0902
1.8474 150500 1.0841
1.8535 151000 1.0961
1.8597 151500 1.0778
1.8658 152000 1.0784
1.8719 152500 1.0741
1.8781 153000 1.0879
1.8842 153500 1.079
1.8904 154000 1.0967
1.8965 154500 1.0906
1.9026 155000 1.0836
1.9088 155500 1.0932
1.9149 156000 1.0823
1.9210 156500 1.087
1.9272 157000 1.0892
1.9333 157500 1.0842
1.9395 158000 1.0837
1.9456 158500 1.1001
1.9517 159000 1.0727
1.9579 159500 1.0875
1.9640 160000 1.0845
1.9701 160500 1.0805
1.9763 161000 1.0825
1.9824 161500 1.0886
1.9886 162000 1.0856
1.9947 162500 1.0816
2.0008 163000 1.1005
2.0070 163500 1.0775
2.0131 164000 1.0875
2.0192 164500 1.09
2.0254 165000 1.086
2.0315 165500 1.087
2.0377 166000 1.0815

Framework Versions

  • Python: 3.10.10
  • Sentence Transformers: 3.3.1
  • Transformers: 4.43.0
  • PyTorch: 2.5.0+cu124
  • Accelerate: 1.1.1
  • Datasets: 3.1.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers and SoftmaxLoss

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}