FareedKhan's picture
Upload folder using huggingface_hub
1ea5d10 verified
metadata
base_model: mixedbread-ai/deepset-mxbai-embed-de-large-v1
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:3262
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: >-
      In welchen Datenbeständen wird das Gesetz UrhG in Bezug auf historische
      topographische Informationen aus dem 18. Jahrhundert referenziert?
    sentences:
      - |

        Datenbestand
            - titel: Parkscheinautomaten (PSA) Standorte öffentlich anzeigen
            - typ: Fachverfahren
            - kurzbeschreibung: Maschinenlesbare Dateien mit aktuellen Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow.
            - allgemeine_beschreibung: Es werden 2 maschinenlesbare Dateien mit den aktuellen Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow bereitgestellt.
            - fachliche_beschreibung: Der Datensatz wird vom Bezirksamt Pankow, Amt für öffentliche Ordnung bereitgestellt. Er dient der Transparenz und der besseren Orientierung im Straßenverkehr in Pankow. Die relevanten Behörden sind das Bezirksamt Pankow und die FITKO (Föderale IT-Kooperation), welche das GovData Portal betreibt.
            - zweck: Der Datensatz wird erhoben, um den Bürgerinnen und Bürgern sowie Besucherinnen und Besuchern von Pankow die Standorte der Parkscheinautomaten (PSA) zugänglich zu machen und somit das Auffinden von Parkmöglichkeiten zu erleichtern.
            - einfuehrungsjahr: 2021
        Datenbestand hat Datenlieferanten
            - name: Amt für öffentliche Ordnung
            - name: Bezirksamt Pankow
        Datenbestand hat Schlagwort
            - name: ticket
            - name: parkscheinautomat
            - name: parkplatz
            - name: parken
            - name: parkraumbewirtschaftung
            - name: pankow
            - name: parkticket
            - name: handyparken
            - name: ordnungsamt
            - name: berlin
        Datenbestand hat Kategorie
            - name: Verkehr
        Datenbestand hat politische Ebenen
            - name: Ebene der Landkreise und Regierungsbezirke
        Datenbestand hat politisches Gebiet
            - name: 110010001003
        Datenbestand hat Sprache
            - name: Deutsch
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Ordnungsamt
            - kurzbezeichnung: OA
            - themen: Öffentliche Ordnung, Ordnungswidrigkeiten, Lebensmittelaufsicht
            - ministerium_des_geschaeftsbereichs: Innere Verwaltung
            - ressort: Ordnungs- und Sicherheitsangelegenheiten
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Gesetz zur Durchführung der Verordnung (EU) 2016/425 des Europäischen Parlaments und des Rates vom 9. März 2016 über persönliche Schutzausrüstungen (PSA)
            - kurzbezeichnung: PSA-DG
        Datenbestand hat Verordnung
        Verordnung
        Verordnung
            - referenz: https://www.transparenz.bremen.de/sixcms/detail.php?gsid=bremen2014_tp.c.69002.de&asl=bremen203_tpgesetz.c.55340.de&template=20_gp_ifg_meta_detail_d
            - bezeichnung: Verordnung über Parkgebühren
      - |

        Datenbestand
            - titel: Naphthalin im Meerwasser 2003
            - typ: Fachverfahren
            - kurzbeschreibung: Messung des Parameters 'Naphthalin im Meerwasser' im Jahr 2003 im Rahmen von Überwachungsprogrammen für Nord- und Ostsee.
            - allgemeine_beschreibung: Der Datensatz 'Naphthalin im Meerwasser 2003' wurde im Rahmen des gemeinsamen Bund/Länder-Messprogramms für die Nord- und Ostsee sowie weiterer Überwachungsprogramme erhoben, um den Parameter 'Naphthalin im Meerwasser' zu bestimmen.
            - fachliche_beschreibung: Der Datensatz wird vom Bundesamt für Seeschifffahrt und Hydrographie (BSH) erhoben. Er dient der Überwachung der Meeresumwelt in Nord- und Ostsee hinsichtlich des Parameters 'Naphthalin im Meerwasser'.
            - zweck: Der Datensatz wird erhoben, um die Konzentration von Naphthalin im Meerwasser zu überwachen und mögliche Umweltauswirkungen zu bewerten.
            - einfuehrungsjahr: 2024
            - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded
            - zeitliche_abdeckung_start: 2003-05-20
            - zeitliche_abdeckung_ende: 2003-08-10
        Datenbestand hat Datenlieferanten
            - name: Bundesamt für Seeschifffahrt und Hydrographie (BSH)
        Datenbestand hat Schlagwort
            - name: open-data
            - name: monitoring
            - name: naphthalene
            - name: nordsee
            - name: bundesamt-für-seeschifffahrt-und-hydrographie
            - name: wasser
            - name: baltic-sea
            - name: the-federal-maritime-and-hydrographic-agency
            - name: naphthalin
            - name: bsh
            - name: opendata
            - name: nap
            - name: ostsee
            - name: north-sea
            - name: national
            - name: 2003
            - name: water
        Datenbestand hat Kategorie
            - name: Wissenschaft und Technologie
            - name: Fischerei
            - name: Verkehr
            - name: Umwelt
            - name: Regionen und Städte
            - name: Landwirtschaft
            - name: Forstwirtschaft und Nahrungsmittel
        Datenbestand hat Sprache
            - name: Deutsch
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium für Wirtschaft und Klimaschutz
            - kurzbezeichnung: BMWK
            - ressorts: Bundesamt für Seeschifffahrt und Hydrographie (BSH)
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Bundesamt für Seeschifffahrt und Hydrographie (BSH)
            - kurzbezeichnung: BSH
            - themen: Seeschifffahrt, Hydrographie, Schifffahrtssicherheit, Meeresumweltschutz
            - ministerium_des_geschaeftsbereichs: Bundesministerium für Verkehr und digitale Infrastruktur
            - ressort: Verkehr
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Grenzwerteverordnung 2003
            - kurzbezeichnung: GKV 2003
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf
            - bezeichnung: Leitfaden zur Anwendung umweltverträglicher Stoffe
        Verordnung
            - referenz: https://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:268:0029:0043:de:PDF
            - bezeichnung: VERORDNUNG (EG) Nr. 1831/2003 DES EUROPÄISCHEN PARLAMENTS UND DES RATES vom 22. September 2003
        Verordnung
            - referenz: https://rathaus.rostock.de/media/rostock_01.a.4984.de/datei/warnowbruecke_u19_umweltfachliche_untersuchungen_wrrl.pdf
            - bezeichnung: Verordnung zum Schutz der Oberflächengewässer
            - kurzbezeichnung: OGewV
        Verordnung
            - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf
            - bezeichnung: Verordnung über Anforderungen an das Einleiten von Abwasser in Gewässer
      - |

        Datenbestand
            - titel: Schmettausches Kartenwerk Brandenburg-Sektion 77, Potsdam
            - typ: Fachverfahren
            - kurzbeschreibung: Historisches topographisches Kartenwerk im Maßstab 1:50.000 für das preußische Staatsgebiet östlich der Weser, erstellt zwischen 1767 und 1787.
            - allgemeine_beschreibung: Das Schmettausche Kartenwerk Brandenburg-Sektion 77, Potsdam, ist ein historisches topographisches Kartenwerk im Maßstab 1:50.000, das zwischen 1767 und 1787 erstellt wurde. Es umfasst insgesamt 270 handgezeichnete Blätter und stellt das damalige preußische Staatsgebiet östlich der Weser detailliert dar. Die Originale des Kartenwerks befinden sich in der Staatsbibliothek zu Berlin - Preußischer Kulturbesitz.
            - fachliche_beschreibung: Das Schmettausche Kartenwerk Brandenburg-Sektion 77, Potsdam, wird von der Landesvermessung und Geobasisinformation Brandenburg (LGB) bereitgestellt. Es gehört zum Ressort der Vermessung, Geobasisinformation und Katasterverwaltung. Die historischen Karten bieten Einblicke in die topographische Darstellung des preußischen Staatsgebiets im 18. Jahrhundert und dienen Forschungszwecken im Bereich der Geographie, Geschichte und Kartographie.
            - zweck: Der Zweck des Datensatzes besteht darin, historische topographische Informationen über das preußische Staatsgebiet östlich der Weser im 18. Jahrhundert bereitzustellen. Das Kartenwerk dient der Erforschung und Analyse historischer Gegebenheiten, insbesondere im Bereich der Vermessung und Kartographie.
            - einfuehrungsjahr: 2024
            - aktualisierungsfrequenz: unbekannt
        Datenbestand hat Datenlieferanten
            - name: Landesvermessung und Geobasisinformation Brandenburg (LGB)
        Datenbestand hat Schlagwort
            - name: preußisches Staatsgebiet
            - name: 150.000
            - name: historisch
            - name: vermessung
            - name: Vermessung
            - name: Kartographie
            - name: opendata
            - name: bodenbedeckung
            - name: karte
            - name: topographie
            - name: 18. Jahrhundert
        Datenbestand hat Kategorie
            - name: Wissenschaft und Technologie
            - name: Fischerei
            - name: Umwelt
            - name: Regierung und öffentlicher Sektor
            - name: Regionen und Städte
            - name: Landwirtschaft
            - name: Forstwirtschaft und Nahrungsmittel
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Landesvermessung und Geobasisinformation Brandenburg (LGB)
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Landesvermessung und Geobasisinformation Brandenburg (LGB)
            - kurzbezeichnung: LGB
            - themen: Vermessung, Geobasisinformation, Katasterverwaltung
            - ministerium_des_geschaeftsbereichs: Ministerium für Infrastruktur und Landesplanung des Landes Brandenburg
            - ressort: Landesvermessung, Geoinformation
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Gesetz über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz)
            - kurzbezeichnung: UrhG
            - paragraph: § 70
        Datenbestand hat Verordnung
        Verordnung
        Verordnung
            - referenz: https://geobasis-bb.de/lgb/de/service/nutzungsbedingungen/
            - bezeichnung: Nutzungsbedingungen des Landesvermessung und Geobasisinformation Brandenburg (LGB)
  - source_sentence: >-
      In welchen Datenbeständen finde ich vom BMI überwachte Informationen zu
      Kinderbetreuungsstätten in Nobitz?
    sentences:
      - |

        Datenbestand
            - titel: Kindertagesstätten der Gemeinde Nobitz und der beauftragenden Gemeinden
            - typ: Fachverfahren
            - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen der Gemeinde Nobitz und beauftragenden Gemeinden.
            - allgemeine_beschreibung: Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Gemeinde Nobitz und der beauftragenden Gemeinden. Es handelt sich um einen Sekundärdatenbestand. Die Kindertagesstätten werden von der Gemeinde Nobitz und den beauftragenden Gemeinden betrieben.
            - fachliche_beschreibung: Der Datensatz zu den Kindertagesstätten wird von der Gemeinde Nobitz und den beauftragenden Gemeinden verwaltet. Zuständige Behörden sind die Gemeinde Nobitz und die beauftragenden Gemeinden, die im Bereich der Kinderbetreuung tätig sind. Die Daten werden regelmäßig aktualisiert und über das FITKO (Föderale IT-Kooperation)  GovData Portal bereitgestellt.
            - zweck: Der Datensatz wird erhoben, um den Bürgern und Bürgerinnen sowie interessierten Personen Informationen über die Standorte von Kindertagesstätten in Nobitz und den beauftragenden Gemeinden zur Verfügung zu stellen. Dies dient der Transparenz und der besseren Zugänglichkeit von Informationen im Bereich der Kinderbetreuung.
            - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded
        Datenbestand hat Datenlieferanten
            - name: Gemeinde Nobitz und der beauftragenden Gemeinden
        Datenbestand hat Schlagwort
            - name: versorgungswirtschaft-und-staatliche-dienste
            - name: kindertagesstätten
            - name: langenleuba-niederhain
            - name: kindergarten
            - name: kinderbetreuung
            - name: thüringen
            - name: opendata
            - name: göpfersdorf
            - name: kinderkrippe
            - name: kita
        Datenbestand hat Kategorie
            - name: Bildung
            - name: Kultur und Sport
            - name: Regierung und öffentlicher Sektor
            - name: Regionen und Städte
            - name: Bevölkerung und Gesellschaft
        Datenbestand hat Sprache
            - name: Deutsch
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Gemeinde Nobitz, beauftragenden Gemeinden
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Gemeinde Nobitz
            - kurzbezeichnung: Nobitz
            - themen: Gemeindeverwaltung, Verwaltungsaufgaben, Kommunalpolitik
            - ministerium_des_geschaeftsbereichs: Thüringer Ministerium für Inneres und Kommunales
            - ressort: Kommunalaufsicht
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Thüringer Kindertageseinrichtungsgesetz
            - kurzbezeichnung: ThürKigaG
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob
            - bezeichnung: Satzung über die Benutzung der Kindertageseinrichtungen in kommunaler Trägerschaft der Gemeinde Nobitz (KitaBenS)
            - kurzbezeichnung: KitaBenS
        Verordnung
            - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob/@@getlink?id=1339072591
            - bezeichnung: Kindertageseinrichtungen in kommunaler Trägerschaft der Gemeinde Nobitz
            - kurzbezeichnung: KitaGebS
        Verordnung
            - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob
            - bezeichnung: Ordnungsbehördliche Verordnung
      - |

        Datenbestand
            - titel: Preußische Urmesstischblätter 1 : 25 000 4345 Herzberg/Elster
            - typ: Fachverfahren
            - kurzbeschreibung: Historische handgezeichnete topographische Karten im Maßstab 1 : 25 000 des gesamten Staatsgebiets Preußens aus dem 19. Jahrhundert.
            - allgemeine_beschreibung: Die Preußischen Urmesstischblätter im Maßstab 1 : 25 000 wurden ab 1822 für das gesamte Staatsgebiet Preußens erstellt. Diese handgezeichneten Karten dienten als Grundlage für kleinere Kartenwerke und markieren den Beginn der topographischen Kartographie in Preußen. Die Karten sind heute als hochwertige Drucke verfügbar und bilden historische Landkarten ab.
            - fachliche_beschreibung: Die Preußischen Urmesstischblätter werden von der Landesvermessung und Geobasisinformation Brandenburg (LGB) erhoben und sind Teil der historischen Kartographie des Landes. Das Ministerium für Infrastruktur und Landesplanung des Landes Brandenburg hat die fachliche Aufsicht über die Erstellung und Bereitstellung dieser historischen Karten.
            - zweck: Die Preußischen Urmesstischblätter werden erhoben, um historische topographische Informationen über das Staatsgebiet Preußens im 19. Jahrhundert bereitzustellen. Sie dienen der Erforschung und Darstellung historischer Landnutzung, Siedlungsstrukturen und topographischer Gegebenheiten.
            - einfuehrungsjahr: 2024
            - aktualisierungsfrequenz: unbekannt
        Datenbestand hat Datenlieferanten
            - name: Landesvermessung und Geobasisinformation Brandenburg (LGB)
        Datenbestand hat Schlagwort
            - name: 125.000
            - name: Katasterverwaltung
            - name: Maßstab 1:25.000
            - name: historisch
            - name: vermessung
            - name: Topographie
            - name: Preußische Urmesstischblätter
            - name: opendata
            - name: bodenbedeckung
            - name: karte
            - name: Historische Karten
            - name: Geobasisinformation
            - name: Landesvermessung
        Datenbestand hat Kategorie
            - name: Wissenschaft und Technologie
            - name: Fischerei
            - name: Umwelt
            - name: Regierung und öffentlicher Sektor
            - name: Regionen und Städte
            - name: Landwirtschaft
            - name: Forstwirtschaft und Nahrungsmittel
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Landesvermessung und Geobasisinformation Brandenburg (LGB)
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Landesvermessung und Geobasisinformation Brandenburg (LGB)
            - kurzbezeichnung: LGB
            - themen: Vermessung, Geobasisinformation, Katasterverwaltung
            - ministerium_des_geschaeftsbereichs: Ministerium für Infrastruktur und Landesplanung des Landes Brandenburg
            - ressort: Landesvermessung, Geoinformation
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Gesetz über die Landesvermessung und Geobasisinformation Brandenburg (VermGeoG Bbg)
            - kurzbezeichnung: VermGeoG Bbg
        Datenbestand hat Verordnung
        Verordnung
            - bezeichnung: Verordnung über die Geodateninfrastruktur Brandenburg (GeoDINV Bbg)
            - kurzbezeichnung: GeoDINV Bbg
        Verordnung
            - bezeichnung: Instruction für die topographischen Arbeiten des Königlich Preußischen Generalstabes von 1821
            - kurzbezeichnung: Instruction 1821
        Verordnung
            - bezeichnung: Erläuterungen zu den Musterblättern für die topographischen Arbeiten des Königlich Preußischen Generalstabes
            - kurzbezeichnung: Erläuterungen Musterblätter
      - |

        Datenbestand
            - titel: Kindertagesstätten
            - typ: Fachverfahren
            - kurzbeschreibung: Stammdaten aller Kindertagesstätten in Schleswig-Holstein mit Informationen wie Einrichtungsnummer, Adresse, pädagogischem Konzept, Trägername und Betreuungsalter.
            - allgemeine_beschreibung: Der Datensatz 'Kindertagesstätten' enthält die Stammdaten aller Kindertagesstätten, die im KitaPortal Schleswig-Holstein enthalten sind. Die Daten umfassen Informationen wie die eindeutige Nummer der Einrichtung, die Anschrift, barrierefreien Zugang, pädagogisches Konzept, Trägername, Betreuungsalter, Öffnungszeiten und mehr.
            - fachliche_beschreibung: Der Datensatz 'Kindertagesstätten' wird vom Ministerium für Soziales, Jugend, Familie, Senioren, Integration und Gleichstellung erhoben. Er enthält relevante Informationen über die Kindertagesstätten in Schleswig-Holstein und dient der Bereitstellung von wichtigen Daten für Eltern, Erziehungsberechtigte und Interessierte.
            - zweck: Der Datensatz wird erhoben, um Transparenz über die vorhandenen Kindertagesstätten in Schleswig-Holstein zu schaffen und Eltern sowie Erziehungsberechtigten bei der Suche nach passenden Betreuungseinrichtungen zu unterstützen.
            - einfuehrungsjahr: 2023
            - zeitliche_abdeckung_start: 2022-12-17T00:00:00
            - zeitliche_abdeckung_ende: 2023-01-17T00:00:00
        Datenbestand hat Datenlieferanten
            - name: Jugend
            - name: Familie
            - name: Senioren
            - name: Ministerium für Soziales
            - name: Integration und Gleichstellung
        Datenbestand hat Schlagwort
            - name: Barrierefreiheit
            - name: Kindertagespflege
            - name: kindergarten
            - name: kindertagestätten
            - name: tagespflege
            - name: Schleswig-Holstein
            - name: kitas
            - name: Pädagogisches Konzept
            - name: Kindergarten
            - name: Kita
            - name: Trägername
            - name: Betreuungsalter
            - name: kindertagespflege
            - name: kindertageseinrichtungen
            - name: Öffnungszeiten
            - name: kita
            - name: kindertagesstätte
            - name: Kindertageseinrichtungen
        Datenbestand hat Kategorie
            - name: Bildung
            - name: Kultur und Sport
        Datenbestand hat Sprache
            - name: Deutsch
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend
            - kurzbezeichnung: BMFSFJ
            - ressorts: Ministerium für Soziales, Jugend, Familie, Senioren, Integration und Gleichstellung
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Ministerium für Soziales, Jugend, Familie, Senioren, Integration und Gleichstellung
            - kurzbezeichnung: MSJFSIG
            - ministerium_des_geschaeftsbereichs: Ministerium für Soziales, Jugend, Familie, Senioren, Integration und Gleichstellung des Landes Schleswig-Holstein
            - ressort: Soziales
        Datenbestand hat Gesetze:
        Gesetz
            - absatz: Teil 2
            - bezeichnung: Kindertagesstättengesetz Schleswig-Holstein
            - kurzbezeichnung: KiTaG SH
            - paragraph: § 4
        Gesetz
            - bezeichnung: KiTa-Qualitätsgesetz
        Datenbestand hat Verordnung
        Verordnung
            - referenz: http://www.schure.de/21130/dvo-nkitag.htm
            - bezeichnung: Verordnung zur Durchführung des Niedersächsischen Gesetzes über Kindertagesstätten und Kindertagespflege
            - kurzbezeichnung: DVO-NKiTaG
  - source_sentence: >-
      In welchen Datenbeständen sind statistische Auswertungen aus dem
      Sterberegister von Roetgen für 2020 enthalten gemäß dem Gesetz zum Schutz
      vor Luftverunreinigung, Geräuschen?
    sentences:
      - |

        Datenbestand
            - titel: Datenbanken Beschäftigungsstatistik
            - typ: Fachverfahren
            - kurzbeschreibung: Monatliche Beschäftigtenkennzahlen nach soziodemographischen Merkmalen und Berufen in Deutschland.
            - allgemeine_beschreibung: Die Datenbanken Beschäftigungsstatistik enthalten monatliche Beschäftigtenkennzahlen nach soziodemographischen Merkmalen sowie der Klassifikation der Berufe. Die Datenbanken werden quartalsweise mit Monatsdaten aktualisiert und bieten einen umfassenden Überblick über die Beschäftigungssituation in Deutschland.
            - fachliche_beschreibung: Die Datenbanken Beschäftigungsstatistik werden von der Statistik der Bundesagentur für Arbeit geführt. Sie bieten detaillierte Informationen über die Beschäftigungssituation in Deutschland und werden quartalsweise mit aktuellen Monatsdaten aktualisiert. Die Daten dienen als Grundlage für Analysen zur Entwicklung des Arbeitsmarktes und der Beschäftigungsdynamik. Zu den relevanten Behörden gehören die Bundesagentur für Arbeit und das Bundesministerium für Arbeit und Soziales.
            - zweck: Der Datensatz wird erhoben, um detaillierte Einblicke in die Beschäftigungssituation in Deutschland zu ermöglichen. Er dient der Analyse von Trends in der Beschäftigung nach verschiedenen Merkmalen wie Alter, Geschlecht, Beruf und Staatsangehörigkeit.
        Datenbestand hat Datenlieferanten
            - name: Statistik der Bundesagentur für Arbeit
        Datenbestand hat Schlagwort
            - name: Arbeitszeit
            - name: Ausschließlich geringfügig Beschäftigte
            - name: Staatsangehörigkeit
            - name: Sozialversicherungspflichtig beschäftigte Auszubildende
            - name: Geschlecht
            - name: Beschäftigung
            - name: Berufe
            - name: Beschäftigte
            - name: Sozialversicherungspflichtig Beschäftigte
            - name: Geringfügig Beschäftigte
            - name: Geringfügig Beschäftigte im Nebenjob
            - name: Alter
        Datenbestand hat Kategorie
            - name: Wirtschaft und Finanzen
            - name: Bevölkerung und Gesellschaft
        Datenbestand hat politische Ebenen
            - name: Bundesebene
        Datenbestand hat geografische Abdeckung
            - name: Kreise
            - name: Deutschland
            - name: Länder
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium für Arbeit und Soziales
            - kurzbezeichnung: BMAS
            - ressorts: Statistik der Bundesagentur für Arbeit
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Bundesagentur für Arbeit (BA)
            - kurzbezeichnung: BA
            - themen: Arbeitsmarkt, Beschäftigungsstatistik, Ressortstatistiken
            - ministerium_des_geschaeftsbereichs: Bundesministerium für Arbeit und Soziales
            - ressort: Bundesagentur für Arbeit
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Verdienststatistikgesetz
            - paragraph: § 4
        Datenbestand hat Verordnung
        Verordnung
            - referenz: SR 431.012.1
            - bezeichnung: Verordnung vom 30. Juni 1993 über statistische Erhebungen
        Verordnung
            - referenz: Entwurf eines Gesetzes zur Einführung eines Registerzensus
            - bezeichnung: Registerzensusgesetz
      - |

        Datenbestand
            - titel: Wahllokale in Lübeck zur Europawahl 2024
            - typ: Fachverfahren
            - kurzbeschreibung: Georeferenzierter Datensatz der Wahllokale in Lübeck zur Europawahl 2024.
            - allgemeine_beschreibung: Der Datensatz enthält georeferenzierte Informationen zu den Wahllokalen in der Hansestadt Lübeck für die Europawahl am 9. Juni 2024. Enthalten sind Angaben wie Wahlbezirksnummer, Name des Wahllokals, Adresse, Hinweise zum Wahllokal, Barrierefreiheit und Koordinaten.
            - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung der Hansestadt Lübeck bereitgestellt und enthält Informationen zu den Wahllokalen, die für die Europawahl am 9. Juni 2024 relevant sind. Die Daten werden im Fachverfahren der Kommunalverwaltung verwaltet und dienen der Unterstützung des Wahlprozesses in Lübeck.
            - zweck: Der Datensatz wird erhoben, um den Bürgern von Lübeck die Standorte der Wahllokale für die Europawahl 2024 zugänglich zu machen und ihnen eine barrierefreie Teilnahme zu ermöglichen.
            - einfuehrungsjahr: 2024
            - zeitliche_abdeckung_start: 2024-06-09T00:00:00
            - zeitliche_abdeckung_ende: 2024-06-09T00:00:00
        Datenbestand hat Datenlieferanten
            - name: Hansestadt Lübeck
        Datenbestand hat Schlagwort
            - name: barrierefreiheit
            - name: wahlbezirk
            - name: wahllokal
            - name: wahl
            - name: stimmbezirk
        Datenbestand hat Kategorie
            - name: Regierung und öffentlicher Sektor
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Hansestadt Lübeck
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Hansestadt Lübeck
            - kurzbezeichnung: Stadtverwaltung
            - themen: Stadtverwaltung, Kommunalverwaltung, Bürgerservice
            - ministerium_des_geschaeftsbereichs: Innenministerium des Landes Schleswig-Holstein
            - ressort: Kommunale Verwaltung
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Europawahlgesetz
        Datenbestand hat Verordnung
        Verordnung
            - bezeichnung: Datenschutzgrundverordnung (DSGVO)
            - kurzbezeichnung: DSGVO
        Verordnung
            - bezeichnung: Europawahlordnung
      - |

        Datenbestand
            - titel: Auswertungen aus dem Sterberegister der Gemeinde Roetgen
            - typ: Fachverfahren
            - kurzbeschreibung: Auswertungen aus dem Sterberegister der Gemeinde Roetgen, Jahr 2020.
            - allgemeine_beschreibung: Der Datensatz enthält Auswertungen aus dem Sterberegister der Gemeinde Roetgen, speziell aus dem Jahr 2020. Die Daten werden jährlich aktualisiert und sind über das GovData Portal verfügbar.
            - fachliche_beschreibung: Der Datensatz wird von der Stadt Aachen bereitgestellt und enthält statistische Auswertungen aus dem Sterberegister der Gemeinde Roetgen. Die Daten dienen der Analyse von Sterbefällen in der Gemeinde und werden unter der fachlichen Aufsicht des Bundesministeriums des Innern und für Heimat veröffentlicht.
            - zweck: Der Datensatz wird erhoben, um Einblicke in Sterbefälle und statistische Auswertungen im Bereich der Gemeinde Roetgen zu ermöglichen.
            - einfuehrungsjahr: 2024
        Datenbestand hat Datenlieferanten
            - name: Aachen
        Datenbestand hat Schlagwort
            - name: sterbefälle
            - name: auswertungen
            - name: Sterbefälle
            - name: Auswertungen
            - name: GovData Portal
            - name: Statistiken
            - name: roetgen
            - name: Jahresbericht
            - name: Gemeinde Roetgen
        Datenbestand hat Kategorie
            - name: Regierung und öffentlicher Sektor
            - name: Regionen und Städte
            - name: Bevölkerung und Gesellschaft
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Stadt Aachen, StädteRegion Aachen, Rathaus Aachen
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Stadt Aachen
            - kurzbezeichnung: Stadtverwaltung Aachen
            - ministerium_des_geschaeftsbereichs: Ministerium des Innern
            - ressort: Kommunales
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Gesetz zum Schutz vor Luftverunreinigung, Geräuschen
            - paragraph: § 5 Abs. 1; 7 Abs. 1; 9 Abs. 3; 10 Abs. 4
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.roetgen.de/wp-content/uploads/2018/06/Ordnungsbeh%C3%B6rdliche-Verordnung-%C3%BCber-die-Aufrechterhaltung-der-%C3%B6ffentlichen-Sicherheit-und-Ordnung.pdf
            - bezeichnung: Ordnungsbehördliche Verordnung - Gemeinde Roetgen
        Verordnung
            - referenz: https://buergerportal.roetgen.de/detail/-/vr-bis-detail/dienstleistung/659/show
            - bezeichnung: Personenstandsurkunden Aufbewahrungsfristen
  - source_sentence: >-
      Welche Datenquellen des BStU bieten Einblicke in die Antragszahlen und
      Verwendungszwecke für Stasi-Unterlagen?
    sentences:
      - |

        Datenbestand
            - titel: Entwicklung der Antragszahlen nach Verwendungszweck
            - typ: Fachverfahren
            - kurzbeschreibung: Anzahl der Anträge und Ersuchen an die Stasi-Unterlagen-Behörde (BStU) nach Verwendungszweck und Jahren gemäß Stasi-Unterlagen-Gesetz (StUG).
            - allgemeine_beschreibung: Der Datensatz bietet eine Übersicht über die Anzahl der an die Stasi-Unterlagen-Behörde (BStU) gestellten Anträge und Ersuchen, aufgeschlüsselt nach Jahren und den jeweiligen Verwendungszwecken gemäß Stasi-Unterlagen-Gesetz (StUG). Die Daten werden vom Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen Republik (BStU) bereitgestellt und sind über das FITKO (Föderale IT-Kooperation)  GovData Portal verfügbar.
            - fachliche_beschreibung: Der Datensatz wird vom Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen Republik (BStU) bereitgestellt. Die Behörde ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt und hat den Auftrag, die Unterlagen des ehemaligen Staatssicherheitsdienstes der DDR zu sichern, zu erforschen und der Öffentlichkeit zugänglich zu machen. Die Antragszahlen geben Einblicke in das Interesse an der Aufarbeitung der Stasi-Unterlagen und dienen der historischen Forschung sowie der Erinnerungskultur.
            - zweck: Der Datensatz wird erhoben, um Transparenz über die Anzahl und die Verwendungszwecke der gestellten Anträge und Ersuchen an die Stasi-Unterlagen-Behörde zu schaffen. Dies dient der Aufarbeitung von Unterlagen des Staatssicherheitsdienstes der ehemaligen DDR und ermöglicht es Forschern, Historikern und der interessierten Öffentlichkeit Einblicke in die Aktivitäten der Stasi zu erhalten.
            - einfuehrungsjahr: 2014
        Datenbestand hat Datenlieferanten
            - name: Der Bundesbeauftragte für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratsichen Republik (BStU)
        Datenbestand hat Schlagwort
            - name: anträge
            - name: antrag
            - name: stug
            - name: staatssicherheit
            - name: ersuchen
            - name: aufarbeitung
            - name: auskunft
            - name: stasi
            - name: ddr
            - name: akteneinsicht
            - name: mfs
            - name: stasi-unterlagen
        Datenbestand hat Kategorie
            - name: Bildung
            - name: Kultur und Sport
            - name: Wissenschaft und Technologie
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Der Bundesbeauftragte für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen Republik (BStU)
            - kurzbezeichnung: BStU
            - themen: Staatssicherheitsdienst, Unterlagen, DDR
            - ministerium_des_geschaeftsbereichs: Bundesministerium des Innern, für Bau und Heimat
            - ressort: Bundesbeauftragter für die Stasi-Unterlagen
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Stasi-Unterlagen-Gesetz
            - kurzbezeichnung: StUG
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.bundesgesundheitsministerium.de/fileadmin/Dateien/3_Downloads/Gesetze_und_Verordnungen/GuV/D/VO_Datentransparenzverordnung.pdf
            - bezeichnung: VO_Datentransparenzverordnung
      - |

        Datenbestand
            - titel: UAV-Lärmmessdaten des RauMoLeS-Projekts
            - typ: Fachverfahren
            - kurzbeschreibung: Lärmmessdaten von UAVs im RauMoLeS-Projekt, inklusive Positionen der Messmikrofone und UAVs, Propellerdrehzahlen und elektrische Gesamtsystemleistung.
            - allgemeine_beschreibung: Der Datensatz enthält Lärmmessdaten von UAVs im Rahmen des RauMoLeS-Projekts. Es gibt Messdaten für das UAV "Manta Ray" und drei verschiedene Konfigurationen des UAV "Minitalon". Die Daten umfassen die Positionen der Messmikrofone und der UAVs, sowie Propellerdrehzahlen und die elektrische Gesamtsystemleistung der UAVs.
            - fachliche_beschreibung: Der Datensatz wird vom Lehrstuhl für Luftfahrtsysteme der Technischen Universität München und der Phoenix-Wings GmbH bereitgestellt. Er dient der Erfassung und Analyse von Lärmemissionen von UAVs, insbesondere im Bereich der Luftfahrt. Das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) ist die zuständige Behörde für Luftfahrtthemen.
            - zweck: Der Datensatz wurde erhoben, um Lärmdaten von UAVs zu sammeln und zu analysieren, insbesondere im Hinblick auf die Auswirkungen auf die Umwelt und die Bevölkerung. Die Daten dienen der Forschung und Entwicklung im Bereich der Luftfahrt.
            - einfuehrungsjahr: 2020
        Datenbestand hat Datenlieferanten
            - name: Prof. Schaller UmweltConsult GmbH
            - name: 2020
            - name: 2020 Flugmessdaten: Phoenix-Wings GmbH
            - name: Technische Universität München
            - name: Lärmdaten: Lehrstuhl für Luftfahrtsysteme
        Datenbestand hat Schlagwort
            - name: Minitalon
            - name: Manta Ray
            - name: mcloud_category_aviation
            - name: mfund-projekt-raumoles
            - name: Propellerdrehzahlen
            - name: mcloud_idd46c56b5-c70e-4fc9-bd54-b62d82db146e
            - name: UAVs
            - name: Gesamtsystemleistung
            - name: Luftfahrt
            - name: Lärmdaten
            - name: RauMoLeS-Projekt
        Datenbestand hat Kategorie
            - name: Verkehr
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium für Verkehr und digitale Infrastruktur
            - kurzbezeichnung: BMDV
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Bundesministerium für Verkehr und digitale Infrastruktur
            - kurzbezeichnung: BMVI
            - themen: Lärmdaten, Flugmessdaten
            - ministerium_des_geschaeftsbereichs: Bundesministerium für Verkehr und digitale Infrastruktur
            - ressort: Luftfahrt
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Bundes-Immissionsschutzgesetz
            - kurzbezeichnung: BImSchG
            - paragraph: 34
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.mcloud.de/export/csv/datasets?page=1&pageSize=198&sortOrder=desc&sortField=latest&aggs=categories%3Aaviation
            - bezeichnung: Verordnung zur Durchführung des Bundes-Immissionsschutzgesetzes
            - kurzbezeichnung: 34. BImSchV
      - |

        Datenbestand
            - titel: Kindertageseinrichtungen in Neckarsulm
            - typ: Fachverfahren
            - kurzbeschreibung: Standorte, Öffnungszeiten und weitere Infos zu Kindertageseinrichtungen in Neckarsulm.
            - allgemeine_beschreibung: Der Datensatz enthält Informationen zu den Standorten, Öffnungszeiten und weiteren Details der Kindertageseinrichtungen in Neckarsulm.
            - fachliche_beschreibung: Der Datensatz wird vom Amt für Stadtentwicklung und Gebäudewirtschaft, Stadtplanung und GIS der Stadt Neckarsulm bereitgestellt. Er enthält relevante Informationen zu den Kindertageseinrichtungen in der Stadt, um Transparenz zu schaffen und Eltern bei der Suche nach einer geeigneten Einrichtung zu unterstützen.
            - zweck: Der Datensatz wird erhoben, um Eltern und Erziehungsberechtigten einen Überblick über die verfügbaren Kindertageseinrichtungen in Neckarsulm zu geben und sie bei der Auswahl einer passenden Einrichtung zu unterstützen.
            - einfuehrungsjahr: 2023
        Datenbestand hat Datenlieferanten
            - name: Stadtplanung und GIS
            - name: Amt für Stadtentwicklung und Gebäudewirtschaft
        Datenbestand hat Schlagwort
            - name: Kindertageseinrichtung
            - name: GIS
            - name: Stadtplanung
            - name: Neckarsulm
            - name: kindertageseinrichtung
            - name: Gebäudewirtschaft
            - name: Kita
            - name: Öffnungszeiten
            - name: kita
            - name: Standorte
            - name: Stadtentwicklung
        Datenbestand hat Kategorie
            - name: Bildung
            - name: Kultur und Sport
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium für Wohnen, Stadtentwicklung und Bauwesen
            - kurzbezeichnung: BMWSB
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Amt für Stadtentwicklung und Gebäudewirtschaft, Stadtplanung und GIS
            - kurzbezeichnung: Stadtentwicklung und Bauamt
            - themen: Stadtentwicklung, Gebäudewirtschaft, Stadtplanung, GIS
            - ministerium_des_geschaeftsbereichs: Bundesministerium des Innern, für Bau und Heimat
            - ressort: Stadtentwicklung, Bau und Wohnungswesen
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Gesetz zur Bildung, Erziehung und Betreuung von Kindern in Kindertageseinrichtungen und in Tagespflege (BayKiBiG)
            - kurzbezeichnung: BayKiBiG
        Gesetz
            - bezeichnung: Kindertagesstättengesetz (KitaG)
            - kurzbezeichnung: KitaG
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.landesrecht-bw.de/bsbw/document/jlr-KiTaVBWV6P1
            - bezeichnung: Verordnung des Kultusministeriums über den Mindestpersonalschlüssel und die Personalfortbildung in Kindergärten und Tageseinrichtungen mit altersgemischten Gruppen (KiTaVO)
            - kurzbezeichnung: KiTaVO
        Verordnung
            - referenz: https://www.bmfsfj.de/bmfsfj/themen/familie/kinderbetreuung/fuer-gute-kinderbetreuung-bundesweit-das-kita-qualitaetsgesetz-209046
            - bezeichnung: KiTa-Qualitätsgesetz
            - kurzbezeichnung: KiTa-Qualitätsgesetz
  - source_sentence: >-
      Welche Datenbestände dokumentieren die Fachaufsicht des BMI über
      Kinderbetreuungseinrichtungen in der Stadt Oberhof?
    sentences:
      - |

        Datenbestand
            - titel: Luftbild 2002
            - typ: Fachverfahren
            - kurzbeschreibung: Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002.
            - allgemeine_beschreibung: Der Datensatz 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16 Metern. Die Ressourcen werden in der Regel nicht aktualisiert.
            - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt, speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer Luftbilder für die Öffentlichkeit.
            - zweck: Der Datensatz wird erhoben, um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung aus dem Jahr 2002 bereitzustellen.
            - einfuehrungsjahr: 2017
            - zeitliche_abdeckung_start: 2002-03-01T00:00:00+01:00
            - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00
        Datenbestand hat Datenlieferanten
            - name: Hanse- und Universitätsstadt Rostock
        Datenbestand hat Schlagwort
            - name: luftbild
            - name: Historisch
            - name: Digitales Orthophoto
            - name: 2002
            - name: Bodenauflösung
            - name: Rostock
            - name: Luftbild
            - name: Hanse- und Universitätsstadt
        Datenbestand hat Kategorie
            - name: Regierung und öffentlicher Sektor
            - name: Regionen und Städte
        Datenbestand hat politische Ebenen
            - name: Ebene der Landkreise und Regierungsbezirke
        Datenbestand hat politisches Gebiet
            - name: Rostock
            - name: Hanse- und Universitätsstadt
        Datenbestand hat Sprache
            - name: Deutsch
        Datenbestand hat geografische Abdeckung
            - name: Rostock und Umgebung
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Hanse- und Universitätsstadt Rostock
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Hanse- und Universitätsstadt Rostock
            - kurzbezeichnung: Rostock
            - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung
            - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern
            - ressort: Kommunalaufsicht
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Bundesdatenschutzgesetz
            - kurzbezeichnung: BDSG
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D
            - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und Ausführung von Luftbildern
        Verordnung
            - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html
            - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern
      - |

        Datenbestand
            - titel: Bebauungspläne
            - typ: Fachverfahren
            - kurzbeschreibung: Der Datensatz enthält Bebauungspläne der Ortsgemeinde Wintrich, die die Nutzung von Grundstücken in bestimmten Gebieten regeln.
            - allgemeine_beschreibung: Der Datensatz umfasst Bebauungspläne, die von der Ortsgemeinde Wintrich bereitgestellt werden. Bebauungspläne sind Satzungen, die von Gemeinden beschlossen werden und die beabsichtigte Bodennutzung in einem bestimmten Gebiet regeln.
            - fachliche_beschreibung: Die Ortsgemeinde Wintrich stellt Bebauungspläne bereit, die im Rahmen der Bauleitplanung gemäß dem Baugesetzbuch (BauGB) erstellt werden. Die Bebauungspläne werden als Satzungen von der Gemeinde beschlossen und regeln die Art der baulichen Nutzung sowie die städtebauliche Entwicklung in einem definierten Gebiet. Zuständig für die Verwaltung und Bereitstellung der Bebauungspläne ist die Kommunalverwaltung der Ortsgemeinde Wintrich.
            - zweck: Die Bebauungspläne dienen dazu, die bauliche und sonstige Nutzung von Grundstücken in einem definierten Gebiet zu regeln. Sie legen fest, welche Art von Bebauung zulässig ist und dienen der städtebaulichen Entwicklung und Ordnung.
            - einfuehrungsjahr: 2022
        Datenbestand hat Datenlieferanten
            - name: Ortsgemeinde Wintrich
        Datenbestand hat Schlagwort
            - name: Ortsgemeinde Wintrich
            - name: städtebauliche Entwicklung
            - name: Bebauungspläne
            - name: Baugesetzbuch
            - name: Bauleitplanung
            - name: Satzungen
        Datenbestand hat Kategorie
            - name: Regierung und öffentlicher Sektor
        Datenbestand hat Sprache
            - name: http://publications.europa.eu/resource/authority/language/GER
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Ortsgemeinde Wintrich
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Ortsgemeinde Wintrich
            - kurzbezeichnung: Ortsgemeinde Wintrich
            - themen: Gemeindeverwaltung, Ortsrecht, Bürgerdienste
            - ministerium_des_geschaeftsbereichs: Ministerium des Innern, für Sport und Infrastruktur Rheinland-Pfalz
            - ressort: Kommunalverwaltung
        Datenbestand hat Gesetze:
        Gesetz
            - absatz: (1) Die Gemeinde beschließt den Bebauungsplan als Satzung. (2) Bebauungspläne nach § 8 Absatz ...
            - bezeichnung: Baugesetzbuch (BauGB)
            - kurzbezeichnung: BauGB
            - paragraph: § 10
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.bmwsb.bund.de/SharedDocs/gesetzgebungsverfahren/Webs/BMWSB/DE/digitalisierung-im-bauleitverfahren.html
            - bezeichnung: Entwurf eines Gesetzes zur Stärkung der Digitalisierung
            - kurzbezeichnung: Digitalisierungsgesetz
        Verordnung
            - referenz: https://recht.nrw.de/lmi/owa/br_bes_text?print=1&anw_nr=1&gld_nr=%202&ugl_nr=2311&val=2493&ver=7&aufgehoben=J&keyword=&bes_id=2493&show_preview=1
            - bezeichnung: Verordnung zur Änderung der Baunutzungsverordnung
            - kurzbezeichnung: BauNVO
      - |

        Datenbestand
            - titel: Kindertagesstätten der Stadt Oberhof
            - typ: Fachverfahren
            - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof.
            - allgemeine_beschreibung: Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen Sekundärdatenbestand.
            - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof und das Thüringer Ministerium für Inneres und Kommunales.
            - zweck: Der Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren Kindertagesstätten und Kinderkrippen bereitzustellen.
            - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded
        Datenbestand hat Datenlieferanten
            - name: Stadt Oberhof
        Datenbestand hat Schlagwort
            - name: versorgungswirtschaft-und-staatliche-dienste
            - name: kindertagesstätten
            - name: kindergarten
            - name: kinderbetreuung
            - name: thüringen
            - name: opendata
            - name: kinderkrippe
            - name: kita
        Datenbestand hat Kategorie
            - name: Bildung
            - name: Kultur und Sport
            - name: Regierung und öffentlicher Sektor
            - name: Regionen und Städte
            - name: Bevölkerung und Gesellschaft
        Datenbestand hat Sprache
            - name: Deutsch
        Datenbestand hat Ministerium
        Ministerium
            - bezeichnung: Bundesministerium des Innern und für Heimat
            - kurzbezeichnung: BMI
            - ressorts: Stadt Oberhof
        Datenbestand hat Behörde
        Behoerde
            - bezeichnung: Stadtverwaltung Oberhof
            - kurzbezeichnung: Stadtverwaltung
            - themen: Verwaltung, Bürgerdienste, Stadtrat, Satzungen
            - ministerium_des_geschaeftsbereichs: Thüringer Ministerium für Inneres und Kommunales
            - ressort: Kommunalverwaltung
        Datenbestand hat Gesetze:
        Gesetz
            - bezeichnung: Thüringer Kindertageseinrichtungsgesetz
            - kurzbezeichnung: ThürKigaG
        Datenbestand hat Verordnung
        Verordnung
            - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf
            - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle für den automatisierten Datenaustausch
        Verordnung
            - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf
            - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung einer erfüllenden Gemeinde
model-index:
  - name: SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 512
          type: dim_512
        metrics:
          - type: cosine_accuracy@1
            value: 0.40814867762687634
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.6311651179413867
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.7176554681915654
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.8077197998570408
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.40814867762687634
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.21038837264712884
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.14353109363831304
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.08077197998570407
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.40814867762687634
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.6311651179413867
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.7176554681915654
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.8077197998570408
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.6045190659045919
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5398677626876347
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.5472345393824497
            name: Cosine Map@100

SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1

This is a sentence-transformers model finetuned from mixedbread-ai/deepset-mxbai-embed-de-large-v1. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'Welche Datenbestände dokumentieren die Fachaufsicht des BMI über Kinderbetreuungseinrichtungen in der Stadt Oberhof?',
    '\nDatenbestand\n    - titel: Kindertagesstätten der Stadt Oberhof\n    - typ: Fachverfahren\n    - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof.\n    - allgemeine_beschreibung: Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen Sekundärdatenbestand.\n    - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof und das Thüringer Ministerium für Inneres und Kommunales.\n    - zweck: Der Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren Kindertagesstätten und Kinderkrippen bereitzustellen.\n    - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\nDatenbestand hat Datenlieferanten\n    - name: Stadt Oberhof\nDatenbestand hat Schlagwort\n    - name: versorgungswirtschaft-und-staatliche-dienste\n    - name: kindertagesstätten\n    - name: kindergarten\n    - name: kinderbetreuung\n    - name: thüringen\n    - name: opendata\n    - name: kinderkrippe\n    - name: kita\nDatenbestand hat Kategorie\n    - name: Bildung\n    - name: Kultur und Sport\n    - name: Regierung und öffentlicher Sektor\n    - name: Regionen und Städte\n    - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n    - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n    - bezeichnung: Bundesministerium des Innern und für Heimat\n    - kurzbezeichnung: BMI\n    - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n    - bezeichnung: Stadtverwaltung Oberhof\n    - kurzbezeichnung: Stadtverwaltung\n    - themen: Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n    - ministerium_des_geschaeftsbereichs: Thüringer Ministerium für Inneres und Kommunales\n    - ressort: Kommunalverwaltung\nDatenbestand hat Gesetze:\nGesetz\n    - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n    - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n    - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n    - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle für den automatisierten Datenaustausch\nVerordnung\n    - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n    - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung einer erfüllenden Gemeinde\n',
    "\nDatenbestand\n    - titel: Luftbild 2002\n    - typ: Fachverfahren\n    - kurzbeschreibung: Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002.\n    - allgemeine_beschreibung: Der Datensatz 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16 Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n    - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt, speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer Luftbilder für die Öffentlichkeit.\n    - zweck: Der Datensatz wird erhoben, um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung aus dem Jahr 2002 bereitzustellen.\n    - einfuehrungsjahr: 2017\n    - zeitliche_abdeckung_start: 2002-03-01T00:00:00+01:00\n    - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\nDatenbestand hat Datenlieferanten\n    - name: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Schlagwort\n    - name: luftbild\n    - name: Historisch\n    - name: Digitales Orthophoto\n    - name: 2002\n    - name: Bodenauflösung\n    - name: Rostock\n    - name: Luftbild\n    - name: Hanse- und Universitätsstadt\nDatenbestand hat Kategorie\n    - name: Regierung und öffentlicher Sektor\n    - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n    - name: Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n    - name: Rostock\n    - name: Hanse- und Universitätsstadt\nDatenbestand hat Sprache\n    - name: Deutsch\nDatenbestand hat geografische Abdeckung\n    - name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n    - bezeichnung: Bundesministerium des Innern und für Heimat\n    - kurzbezeichnung: BMI\n    - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Behörde\nBehoerde\n    - bezeichnung: Hanse- und Universitätsstadt Rostock\n    - kurzbezeichnung: Rostock\n    - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung\n    - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern\n    - ressort: Kommunalaufsicht\nDatenbestand hat Gesetze:\nGesetz\n    - bezeichnung: Bundesdatenschutzgesetz\n    - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n    - referenz: https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n    - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und Ausführung von Luftbildern\nVerordnung\n    - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n    - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.4081
cosine_accuracy@3 0.6312
cosine_accuracy@5 0.7177
cosine_accuracy@10 0.8077
cosine_precision@1 0.4081
cosine_precision@3 0.2104
cosine_precision@5 0.1435
cosine_precision@10 0.0808
cosine_recall@1 0.4081
cosine_recall@3 0.6312
cosine_recall@5 0.7177
cosine_recall@10 0.8077
cosine_ndcg@10 0.6045
cosine_mrr@10 0.5399
cosine_map@100 0.5472

Training Details

Training Dataset

Unnamed Dataset

  • Size: 3,262 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 15 tokens
    • mean: 29.17 tokens
    • max: 53 tokens
    • min: 308 tokens
    • mean: 510.05 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Welche Datenbestände decken die Region Rostock und Umgebung ab und enthalten Informationen zu Verkehrswegen und -sicherheit?
    Datenbestand
    - titel: Großraum- und Schwertransportrouten
    - typ: Fachverfahren
    - kurzbeschreibung: Empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung mit Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind.
    - allgemeine_beschreibung: Der Datensatz umfasst die empfohlenen Großraum- und Schwertransportwege in der Hanse- und Universitätsstadt Rostock und Umgebung. Er enthält Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind. Die Ressourcen werden regelmäßig alle 365 Tage aktualisiert.
    - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt. Zuständige Behörden sind das Ministerium für Inneres und Europa Mecklenburg-Vorpommern mit dem Ressort Kommunalaufsicht. Die Daten enthalten wichtige Informationen für die Verkehrsplanung und -sicherheit in Rostock und Umgebung.
    - zweck: Der Datensatz wird erhoben, um Informationen über empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung bereitzustellen. Er dient der Planung und Durchführung von Großraum- und Schwertransporten sowie der Sicherstellung der Verkehrssicherheit und Infrastrukturintegrität.
    - einfuehrungsjahr: 2018
    Datenbestand hat Datenlieferanten
    - name: Hanse- und Universitätsstadt Rostock
    Datenbestand hat Schlagwort
    - name: verkehrsinfrastruktur
    - name: Erlaubnis
    - name: Genehmigung
    - name: straßennetz
    - name: stadtverkehr
    - name: infrastruktur
    - name: brücke
    - name: Großraum- und Schwertransport
    - name: straßenverkehrstechnik
    - name: tunnel
    - name: verkehr
    - name: bauwerk
    - name: Straßenverkehrs-Ordnung
    - name: öffentlicher-verkehr
    - name: straße
    - name: verkehrstechnik
    - name: straßenverkehr
    - name: öffentliche-straße
    - name: Straßenverkehrszulassungsverordnung
    Datenbestand hat Kategorie
    - name: Verkehr
    - name: Regierung und öffentlicher Sektor
    - name: Regionen und Städte
    Datenbestand hat politische Ebenen
    - name: Ebene der Landkreise und Regierungsbezirke
    Datenbestand hat politisches Gebiet
    - name: Rostock
    - name: Hanse- und Universitätsstadt
    Datenbestand hat Sprache
    - name: Deutsch
    Datenbestand hat geografische Abdeckung
    - name: Rostock und Umgebung
    Datenbestand hat Ministerium
    Ministerium
    - bezeichnung: Bundesministerium des Innern und für Heimat
    - kurzbezeichnung: BMI
    - ressorts: Hanse- und Universitätsstadt Rostock
    Datenbestand hat Behörde
    Behoerde
    - bezeichnung: Hanse- und Universitätsstadt Rostock
    - kurzbezeichnung: Rostock
    - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung
    - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern
    - ressort: Kommunalaufsicht
    Datenbestand hat Gesetze:
    Gesetz
    - absatz: 3
    - bezeichnung: Straßenverkehrs-Ordnung (StVO)
    - kurzbezeichnung: StVO
    - paragraph: § 29
    Datenbestand hat Verordnung
    Verordnung
    - referenz: https://www.buzer.de/StTbV.htm
    - bezeichnung: Straßenverkehr-Transportbegleitungsverordnung (StTbV)
    - kurzbezeichnung: StTbV
    Verordnung
    - referenz: https://www.buzer.de/StTbV.htm
    - bezeichnung: Straßenverkehrs-Zulassungs-Ordnung (StVZO)
    - kurzbezeichnung: StVZO
    Welche Datenbestände bieten Einblicke in die Standorte und Strukturen des THW für Koordinationszwecke im Katastrophenschutz?
    Datenbestand
    - titel: Übersicht der THW-Liegenschaften
    - typ: Fachverfahren
    - kurzbeschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Adressen und Geoinformationen zu den Standorten des Technischen Hilfswerks (THW) in Deutschland.
    - allgemeine_beschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Informationen über die verschiedenen Standorte des Technischen Hilfswerks (THW) in Deutschland. Dazu gehören 668 Ortsverbände, 66 Geschäftsstellen, acht Landesverbände, eine Bundesschule mit zwei Standorten und die THW-Leitung. Die Daten enthalten Adressen und Geoinformationen zu den THW-Liegenschaften.
    - fachliche_beschreibung: Der Datensatz wird von der Bundesanstalt Technisches Hilfswerk erhoben und bereitgestellt. Das THW ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt und hat als Aufgaben den Katastrophenschutz, technisch-humanitäre Hilfeleistungen und die Organisation von Einsatzkräften. Die Daten werden vom Referat Z2 - Organisation des THW geliefert und sind über das GovData Portal verfügbar.
    - zweck: Der Datensatz wird erhoben, um einen umfassenden Überblick über die Standorte und Strukturen des Technischen Hilfswerks in Deutschland zu bieten. Er dient der Transparenz und kann für Planungs- und Koordinationszwecke im Bereich des Katastrophenschutzes und der technisch-humanitären Hilfeleistungen genutzt werden.
    - einfuehrungsjahr: 2015
    - zeitliche_abdeckung_start: 2015-01-01T00:00:00
    Datenbestand hat Datenlieferanten
    - name: Referat Z2 - Organisation
    - name: Bundesanstalt Technisches Hilfswerk
    Datenbestand hat Schlagwort
    - name: THW-Landesverband
    - name: THW-Ortsverband
    - name: Rettung
    - name: Katastrophenschutz
    - name: Bergung
    - name: THW-Leitung
    - name: THW-Dienststellen
    - name: technisch-humanitäre Hilfeleistungen
    - name: THW-Liegenschaft
    - name: Geoinformationen
    - name: THW
    - name: THW-Geschäftsstelle
    Datenbestand hat Ministerium
    Ministerium
    - bezeichnung: Bundesministerium des Innern und für Heimat
    - kurzbezeichnung: BMI
    - ressorts: Bundesanstalt Technisches Hilfswerk, Referat Z2 - Organisation
    Datenbestand hat Behörde
    Behoerde
    - bezeichnung: Bundesanstalt Technisches Hilfswerk
    - kurzbezeichnung: THW
    - themen: Katastrophenschutz, technisch-humanitäre Hilfeleistungen, Organisation von Einsatzkräften
    - ministerium_des_geschaeftsbereichs: Bundesministerium des Innern, für Bau und Heimat
    - ressort: Geschäftsbereich des Bundesministeriums des Innern, für Bau und Heimat
    Datenbestand hat Gesetze:
    Gesetz
    - absatz: 1
    - bezeichnung: Gesetz über das Technische Hilfswerk (THW-Gesetz)
    - kurzbezeichnung: THWG
    - paragraph: § 4
    Datenbestand hat Verordnung
    Verordnung
    - referenz: https://beck-online.beck.de/Normen/29337/T?pagenr=21&sortField=1&sortDirection=1
    - bezeichnung: Technisches Hilfswerk-Auslandsunfallfürsorgeverordnung
    - kurzbezeichnung: THW-AuslUFV
    Verordnung
    - referenz: https://ov-ludwigsburg.thw.de/fileadmin/user_upload/LVBW/GSTU/OLUD/Mediathek/Dokumente/thw_go_ea_anlage_00.pdf
    - bezeichnung: Geschäftsordnung des Technischen Hilfswerks
    - kurzbezeichnung: THW-GO
    Welche Datensätze analysieren die Geschlechterverteilung von Schulabgängern ohne Abschluss in deutschen Kreisen von 2006 bis 2021?
    Datenbestand
    - titel: Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen
    - typ: Fachverfahren
    - kurzbeschreibung: Prozentualer Anteil von Frauen und Männern an Schulabgängern ohne Hauptschulabschluss nach Kreisen
    - allgemeine_beschreibung: Der Datensatz enthält den prozentualen Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen in Deutschland.
    - fachliche_beschreibung: Der Datensatz wird vom Bundesministerium für Familie, Senioren, Frauen und Jugend bereitgestellt und enthält Informationen über den Anteil von Frauen und Männern an Schulabgängern ohne ersten Schulabschluss aus allgemeinbildenden Schulen in Deutschland. Die Daten werden nach Kreisen aufgeschlüsselt und dienen der Analyse der Bildungssituation in verschiedenen Regionen des Landes.
    - zweck: Der Datensatz wird erhoben, um die Geschlechterverteilung bei Schulabgängern ohne Hauptschulabschluss in verschiedenen Regionen Deutschlands zu analysieren und mögliche Maßnahmen zur Verbesserung der Bildungschancen zu entwickeln.
    - einfuehrungsjahr: 2023
    - zeitliche_abdeckung_start: 2006-01-01
    - zeitliche_abdeckung_ende: 2021-12-31
    Datenbestand hat Datenlieferanten
    - name: Bundesministerium für Familie
    - name: Frauen und Jugend
    - name: Senioren
    Datenbestand hat Schlagwort
    - name: bildung
    - name: schulabbrecher
    - name: gleichstellung
    - name: schulabschluss
    - name: schule
    Datenbestand hat Kategorie
    - name: Bevölkerung und Gesellschaft
    Datenbestand hat politische Ebenen
    - name: Ebene der Landkreise und Regierungsbezirke
    Datenbestand hat Sprache
    - name: Deutsch
    Datenbestand hat geografische Abdeckung
    - name: Bundesrepublik Deutschland
    - name: aufgeschlüsselt nach Kreisen
    Datenbestand hat Ministerium
    Ministerium
    - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend
    - kurzbezeichnung: BMFSFJ
    - ressorts: Familie, Senioren, Frauen, Jugend
    Datenbestand hat Behörde
    Behoerde
    - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend
    - kurzbezeichnung: BMFSFJ
    - ministerium_des_geschaeftsbereichs: Bundesministerium für Familie, Senioren, Frauen und Jugend
    - ressort: Bundesministerium für Familie, Senioren, Frauen und Jugend
    Datenbestand hat Gesetze:
    Gesetz
    - bezeichnung: E-Government-Gesetz
    Datenbestand hat Verordnung
    Verordnung
    Verordnung
    - referenz: https://recht.nrw.de/lmi/owa/br_vbl_detail_text?anw_nr=6&vd_id=20346&vd_back=N405&sg=0&menu=0
    - bezeichnung: § 50 Schulgesetz NRW
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            512
        ],
        "matryoshka_weights": [
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • learning_rate: 1e-05
  • warmup_ratio: 0.1
  • bf16: True
  • tf32: False
  • load_best_model_at_end: True

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 8
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 1e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: False
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss dim_512_cosine_map@100
0 0 - 0.5212
0.0490 10 1.2397 -
0.0980 20 0.7542 -
0.1471 30 0.3055 -
0.1961 40 0.2075 -
0.2451 50 0.2064 -
0.2941 60 0.1429 -
0.3431 70 0.1821 -
0.3922 80 0.063 -
0.4412 90 0.078 -
0.4902 100 0.1026 -
0.5392 110 0.0717 -
0.5882 120 0.0394 -
0.6373 130 0.0751 -
0.6863 140 0.1377 -
0.7353 150 0.0666 -
0.7843 160 0.127 -
0.8333 170 0.1129 -
0.8824 180 0.0734 -
0.9314 190 0.0727 -
0.9804 200 0.1564 -
1.0 204 - 0.5428
1.0294 210 0.0904 -
1.0784 220 0.0974 -
1.1275 230 0.0785 -
1.1765 240 0.0704 -
1.2255 250 0.0929 -
1.2745 260 0.1119 -
1.3235 270 0.0459 -
1.3725 280 0.1181 -
1.4216 290 0.0459 -
1.4706 300 0.0248 -
1.5196 310 0.0567 -
1.5686 320 0.0247 -
1.6176 330 0.0412 -
1.6667 340 0.0498 -
1.7157 350 0.0693 -
1.7647 360 0.0589 -
1.8137 370 0.0383 -
1.8627 380 0.0429 -
1.9118 390 0.0466 -
1.9608 400 0.0331 -
2.0 408 - 0.5469
2.0098 410 0.0812 -
2.0588 420 0.0705 -
2.1078 430 0.0215 -
2.1569 440 0.0571 -
2.2059 450 0.0821 -
2.2549 460 0.046 -
2.3039 470 0.0165 -
2.3529 480 0.0335 -
2.4020 490 0.0339 -
2.4510 500 0.0291 -
2.5 510 0.0788 -
2.5490 520 0.0468 -
2.5980 530 0.0457 -
2.6471 540 0.0121 -
2.6961 550 0.0543 -
2.7451 560 0.0463 -
2.7941 570 0.0974 -
2.8431 580 0.0204 -
2.8922 590 0.012 -
2.9412 600 0.0545 -
2.9902 610 0.0581 -
3.0 612 - 0.5472
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.1.1
  • Transformers: 4.45.2
  • PyTorch: 2.4.1+cu121
  • Accelerate: 1.0.0
  • Datasets: 3.0.1
  • Tokenizers: 0.20.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}