FareedKhan commited on
Commit
1ea5d10
1 Parent(s): 1fd1803

Upload folder using huggingface_hub

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1064 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: mixedbread-ai/deepset-mxbai-embed-de-large-v1
3
+ library_name: sentence-transformers
4
+ metrics:
5
+ - cosine_accuracy@1
6
+ - cosine_accuracy@3
7
+ - cosine_accuracy@5
8
+ - cosine_accuracy@10
9
+ - cosine_precision@1
10
+ - cosine_precision@3
11
+ - cosine_precision@5
12
+ - cosine_precision@10
13
+ - cosine_recall@1
14
+ - cosine_recall@3
15
+ - cosine_recall@5
16
+ - cosine_recall@10
17
+ - cosine_ndcg@10
18
+ - cosine_mrr@10
19
+ - cosine_map@100
20
+ pipeline_tag: sentence-similarity
21
+ tags:
22
+ - sentence-transformers
23
+ - sentence-similarity
24
+ - feature-extraction
25
+ - generated_from_trainer
26
+ - dataset_size:3262
27
+ - loss:MatryoshkaLoss
28
+ - loss:MultipleNegativesRankingLoss
29
+ widget:
30
+ - source_sentence: In welchen Datenbeständen wird das Gesetz UrhG in Bezug auf historische
31
+ topographische Informationen aus dem 18. Jahrhundert referenziert?
32
+ sentences:
33
+ - "\nDatenbestand\n - titel: Parkscheinautomaten (PSA) Standorte öffentlich anzeigen\n\
34
+ \ - typ: Fachverfahren\n - kurzbeschreibung: Maschinenlesbare Dateien mit\
35
+ \ aktuellen Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow.\n -\
36
+ \ allgemeine_beschreibung: Es werden 2 maschinenlesbare Dateien mit den aktuellen\
37
+ \ Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow bereitgestellt.\n\
38
+ \ - fachliche_beschreibung: Der Datensatz wird vom Bezirksamt Pankow, Amt für\
39
+ \ öffentliche Ordnung bereitgestellt. Er dient der Transparenz und der besseren\
40
+ \ Orientierung im Straßenverkehr in Pankow. Die relevanten Behörden sind das Bezirksamt\
41
+ \ Pankow und die FITKO (Föderale IT-Kooperation), welche das GovData Portal betreibt.\n\
42
+ \ - zweck: Der Datensatz wird erhoben, um den Bürgerinnen und Bürgern sowie\
43
+ \ Besucherinnen und Besuchern von Pankow die Standorte der Parkscheinautomaten\
44
+ \ (PSA) zugänglich zu machen und somit das Auffinden von Parkmöglichkeiten zu\
45
+ \ erleichtern.\n - einfuehrungsjahr: 2021\nDatenbestand hat Datenlieferanten\n\
46
+ \ - name: Amt für öffentliche Ordnung\n - name: Bezirksamt Pankow\nDatenbestand\
47
+ \ hat Schlagwort\n - name: ticket\n - name: parkscheinautomat\n - name:\
48
+ \ parkplatz\n - name: parken\n - name: parkraumbewirtschaftung\n - name:\
49
+ \ pankow\n - name: parkticket\n - name: handyparken\n - name: ordnungsamt\n\
50
+ \ - name: berlin\nDatenbestand hat Kategorie\n - name: Verkehr\nDatenbestand\
51
+ \ hat politische Ebenen\n - name: Ebene der Landkreise und Regierungsbezirke\n\
52
+ Datenbestand hat politisches Gebiet\n - name: 110010001003\nDatenbestand hat\
53
+ \ Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n \
54
+ \ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
55
+ \ BMI\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Ordnungsamt\n \
56
+ \ - kurzbezeichnung: OA\n - themen: Öffentliche Ordnung, Ordnungswidrigkeiten,\
57
+ \ Lebensmittelaufsicht\n - ministerium_des_geschaeftsbereichs: Innere Verwaltung\n\
58
+ \ - ressort: Ordnungs- und Sicherheitsangelegenheiten\nDatenbestand hat Gesetze:\n\
59
+ Gesetz\n - bezeichnung: Gesetz zur Durchführung der Verordnung (EU) 2016/425\
60
+ \ des Europäischen Parlaments und des Rates vom 9. März 2016 über persönliche\
61
+ \ Schutzausrüstungen (PSA)\n - kurzbezeichnung: PSA-DG\nDatenbestand hat Verordnung\n\
62
+ Verordnung\nVerordnung\n - referenz: https://www.transparenz.bremen.de/sixcms/detail.php?gsid=bremen2014_tp.c.69002.de&asl=bremen203_tpgesetz.c.55340.de&template=20_gp_ifg_meta_detail_d\n\
63
+ \ - bezeichnung: Verordnung über Parkgebühren\n"
64
+ - "\nDatenbestand\n - titel: Naphthalin im Meerwasser 2003\n - typ: Fachverfahren\n\
65
+ \ - kurzbeschreibung: Messung des Parameters 'Naphthalin im Meerwasser' im\
66
+ \ Jahr 2003 im Rahmen von Überwachungsprogrammen für Nord- und Ostsee.\n -\
67
+ \ allgemeine_beschreibung: Der Datensatz 'Naphthalin im Meerwasser 2003' wurde\
68
+ \ im Rahmen des gemeinsamen Bund/Länder-Messprogramms für die Nord- und Ostsee\
69
+ \ sowie weiterer Überwachungsprogramme erhoben, um den Parameter 'Naphthalin im\
70
+ \ Meerwasser' zu bestimmen.\n - fachliche_beschreibung: Der Datensatz wird\
71
+ \ vom Bundesamt für Seeschifffahrt und Hydrographie (BSH) erhoben. Er dient der\
72
+ \ Überwachung der Meeresumwelt in Nord- und Ostsee hinsichtlich des Parameters\
73
+ \ 'Naphthalin im Meerwasser'.\n - zweck: Der Datensatz wird erhoben, um die\
74
+ \ Konzentration von Naphthalin im Meerwasser zu überwachen und mögliche Umweltauswirkungen\
75
+ \ zu bewerten.\n - einfuehrungsjahr: 2024\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
76
+ \ - zeitliche_abdeckung_start: 2003-05-20\n - zeitliche_abdeckung_ende:\
77
+ \ 2003-08-10\nDatenbestand hat Datenlieferanten\n - name: Bundesamt für Seeschifffahrt\
78
+ \ und Hydrographie (BSH)\nDatenbestand hat Schlagwort\n - name: open-data\n\
79
+ \ - name: monitoring\n - name: naphthalene\n - name: nordsee\n - name:\
80
+ \ bundesamt-für-seeschifffahrt-und-hydrographie\n - name: wasser\n - name:\
81
+ \ baltic-sea\n - name: the-federal-maritime-and-hydrographic-agency\n -\
82
+ \ name: naphthalin\n - name: bsh\n - name: opendata\n - name: nap\n \
83
+ \ - name: ostsee\n - name: north-sea\n - name: national\n - name: 2003\n\
84
+ \ - name: water\nDatenbestand hat Kategorie\n - name: Wissenschaft und Technologie\n\
85
+ \ - name: Fischerei\n - name: Verkehr\n - name: Umwelt\n - name: Regionen\
86
+ \ und Städte\n - name: Landwirtschaft\n - name: Forstwirtschaft und Nahrungsmittel\n\
87
+ Datenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\n\
88
+ Ministerium\n - bezeichnung: Bundesministerium für Wirtschaft und Klimaschutz\n\
89
+ \ - kurzbezeichnung: BMWK\n - ressorts: Bundesamt für Seeschifffahrt und\
90
+ \ Hydrographie (BSH)\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesamt\
91
+ \ für Seeschifffahrt und Hydrographie (BSH)\n - kurzbezeichnung: BSH\n -\
92
+ \ themen: Seeschifffahrt, Hydrographie, Schifffahrtssicherheit, Meeresumweltschutz\n\
93
+ \ - ministerium_des_geschaeftsbereichs: Bundesministerium für Verkehr und digitale\
94
+ \ Infrastruktur\n - ressort: Verkehr\nDatenbestand hat Gesetze:\nGesetz\n \
95
+ \ - bezeichnung: Grenzwerteverordnung 2003\n - kurzbezeichnung: GKV 2003\n\
96
+ Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf\n\
97
+ \ - bezeichnung: Leitfaden zur Anwendung umweltverträglicher Stoffe\nVerordnung\n\
98
+ \ - referenz: https://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:268:0029:0043:de:PDF\n\
99
+ \ - bezeichnung: VERORDNUNG (EG) Nr. 1831/2003 DES EUROPÄISCHEN PARLAMENTS\
100
+ \ UND DES RATES vom 22. September 2003\nVerordnung\n - referenz: https://rathaus.rostock.de/media/rostock_01.a.4984.de/datei/warnowbruecke_u19_umweltfachliche_untersuchungen_wrrl.pdf\n\
101
+ \ - bezeichnung: Verordnung zum Schutz der Oberflächengewässer\n - kurzbezeichnung:\
102
+ \ OGewV\nVerordnung\n - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf\n\
103
+ \ - bezeichnung: Verordnung über Anforderungen an das Einleiten von Abwasser\
104
+ \ in Gewässer\n"
105
+ - "\nDatenbestand\n - titel: Schmettausches Kartenwerk Brandenburg-Sektion 77,\
106
+ \ Potsdam\n - typ: Fachverfahren\n - kurzbeschreibung: Historisches topographisches\
107
+ \ Kartenwerk im Maßstab 1:50.000 für das preußische Staatsgebiet östlich der Weser,\
108
+ \ erstellt zwischen 1767 und 1787.\n - allgemeine_beschreibung: Das Schmettausche\
109
+ \ Kartenwerk Brandenburg-Sektion 77, Potsdam, ist ein historisches topographisches\
110
+ \ Kartenwerk im Maßstab 1:50.000, das zwischen 1767 und 1787 erstellt wurde. Es\
111
+ \ umfasst insgesamt 270 handgezeichnete Blätter und stellt das damalige preußische\
112
+ \ Staatsgebiet östlich der Weser detailliert dar. Die Originale des Kartenwerks\
113
+ \ befinden sich in der Staatsbibliothek zu Berlin - Preußischer Kulturbesitz.\n\
114
+ \ - fachliche_beschreibung: Das Schmettausche Kartenwerk Brandenburg-Sektion\
115
+ \ 77, Potsdam, wird von der Landesvermessung und Geobasisinformation Brandenburg\
116
+ \ (LGB) bereitgestellt. Es gehört zum Ressort der Vermessung, Geobasisinformation\
117
+ \ und Katasterverwaltung. Die historischen Karten bieten Einblicke in die topographische\
118
+ \ Darstellung des preußischen Staatsgebiets im 18. Jahrhundert und dienen Forschungszwecken\
119
+ \ im Bereich der Geographie, Geschichte und Kartographie.\n - zweck: Der Zweck\
120
+ \ des Datensatzes besteht darin, historische topographische Informationen über\
121
+ \ das preußische Staatsgebiet östlich der Weser im 18. Jahrhundert bereitzustellen.\
122
+ \ Das Kartenwerk dient der Erforschung und Analyse historischer Gegebenheiten,\
123
+ \ insbesondere im Bereich der Vermessung und Kartographie.\n - einfuehrungsjahr:\
124
+ \ 2024\n - aktualisierungsfrequenz: unbekannt\nDatenbestand hat Datenlieferanten\n\
125
+ \ - name: Landesvermessung und Geobasisinformation Brandenburg (LGB)\nDatenbestand\
126
+ \ hat Schlagwort\n - name: preußisches Staatsgebiet\n - name: 150.000\n\
127
+ \ - name: historisch\n - name: vermessung\n - name: Vermessung\n -\
128
+ \ name: Kartographie\n - name: opendata\n - name: bodenbedeckung\n -\
129
+ \ name: karte\n - name: topographie\n - name: 18. Jahrhundert\nDatenbestand\
130
+ \ hat Kategorie\n - name: Wissenschaft und Technologie\n - name: Fischerei\n\
131
+ \ - name: Umwelt\n - name: Regierung und öffentlicher Sektor\n - name:\
132
+ \ Regionen und Städte\n - name: Landwirtschaft\n - name: Forstwirtschaft\
133
+ \ und Nahrungsmittel\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
134
+ \ Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n \
135
+ \ - ressorts: Landesvermessung und Geobasisinformation Brandenburg (LGB)\nDatenbestand\
136
+ \ hat Behörde\nBehoerde\n - bezeichnung: Landesvermessung und Geobasisinformation\
137
+ \ Brandenburg (LGB)\n - kurzbezeichnung: LGB\n - themen: Vermessung, Geobasisinformation,\
138
+ \ Katasterverwaltung\n - ministerium_des_geschaeftsbereichs: Ministerium für\
139
+ \ Infrastruktur und Landesplanung des Landes Brandenburg\n - ressort: Landesvermessung,\
140
+ \ Geoinformation\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Gesetz\
141
+ \ über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz)\n - kurzbezeichnung:\
142
+ \ UrhG\n - paragraph: § 70\nDatenbestand hat Verordnung\nVerordnung\nVerordnung\n\
143
+ \ - referenz: https://geobasis-bb.de/lgb/de/service/nutzungsbedingungen/\n\
144
+ \ - bezeichnung: Nutzungsbedingungen des Landesvermessung und Geobasisinformation\
145
+ \ Brandenburg (LGB)\n"
146
+ - source_sentence: In welchen Datenbeständen finde ich vom BMI überwachte Informationen
147
+ zu Kinderbetreuungsstätten in Nobitz?
148
+ sentences:
149
+ - "\nDatenbestand\n - titel: Kindertagesstätten der Gemeinde Nobitz und der beauftragenden\
150
+ \ Gemeinden\n - typ: Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten\
151
+ \ und Kinderkrippen der Gemeinde Nobitz und beauftragenden Gemeinden.\n - allgemeine_beschreibung:\
152
+ \ Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Gemeinde\
153
+ \ Nobitz und der beauftragenden Gemeinden. Es handelt sich um einen Sekundärdatenbestand.\
154
+ \ Die Kindertagesstätten werden von der Gemeinde Nobitz und den beauftragenden\
155
+ \ Gemeinden betrieben.\n - fachliche_beschreibung: Der Datensatz zu den Kindertagesstätten\
156
+ \ wird von der Gemeinde Nobitz und den beauftragenden Gemeinden verwaltet. Zuständige\
157
+ \ Behörden sind die Gemeinde Nobitz und die beauftragenden Gemeinden, die im Bereich\
158
+ \ der Kinderbetreuung tätig sind. Die Daten werden regelmäßig aktualisiert und\
159
+ \ über das FITKO (Föderale IT-Kooperation) – GovData Portal bereitgestellt.\n\
160
+ \ - zweck: Der Datensatz wird erhoben, um den Bürgern und Bürgerinnen sowie\
161
+ \ interessierten Personen Informationen über die Standorte von Kindertagesstätten\
162
+ \ in Nobitz und den beauftragenden Gemeinden zur Verfügung zu stellen. Dies dient\
163
+ \ der Transparenz und der besseren Zugänglichkeit von Informationen im Bereich\
164
+ \ der Kinderbetreuung.\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
165
+ Datenbestand hat Datenlieferanten\n - name: Gemeinde Nobitz und der beauftragenden\
166
+ \ Gemeinden\nDatenbestand hat Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n\
167
+ \ - name: kindertagesstätten\n - name: langenleuba-niederhain\n - name:\
168
+ \ kindergarten\n - name: kinderbetreuung\n - name: thüringen\n - name:\
169
+ \ opendata\n - name: göpfersdorf\n - name: kinderkrippe\n - name: kita\n\
170
+ Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
171
+ \ - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n\
172
+ \ - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n - name:\
173
+ \ Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium\
174
+ \ des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Gemeinde\
175
+ \ Nobitz, beauftragenden Gemeinden\nDatenbestand hat Behörde\nBehoerde\n -\
176
+ \ bezeichnung: Gemeinde Nobitz\n - kurzbezeichnung: Nobitz\n - themen: Gemeindeverwaltung,\
177
+ \ Verwaltungsaufgaben, Kommunalpolitik\n - ministerium_des_geschaeftsbereichs:\
178
+ \ Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalaufsicht\n\
179
+ Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n\
180
+ \ - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n \
181
+ \ - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob\n\
182
+ \ - bezeichnung: Satzung über die Benutzung der Kindertageseinrichtungen in\
183
+ \ kommunaler Trägerschaft der Gemeinde Nobitz (KitaBenS)\n - kurzbezeichnung:\
184
+ \ KitaBenS\nVerordnung\n - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob/@@getlink?id=1339072591\n\
185
+ \ - bezeichnung: Kindertageseinrichtungen in kommunaler Trägerschaft der Gemeinde\
186
+ \ Nobitz\n - kurzbezeichnung: KitaGebS\nVerordnung\n - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob\n\
187
+ \ - bezeichnung: Ordnungsbehördliche Verordnung\n"
188
+ - "\nDatenbestand\n - titel: Preußische Urmesstischblätter 1 : 25 000 4345 Herzberg/Elster\n\
189
+ \ - typ: Fachverfahren\n - kurzbeschreibung: Historische handgezeichnete\
190
+ \ topographische Karten im Maßstab 1 : 25 000 des gesamten Staatsgebiets Preußens\
191
+ \ aus dem 19. Jahrhundert.\n - allgemeine_beschreibung: Die Preußischen Urmesstischblätter\
192
+ \ im Maßstab 1 : 25 000 wurden ab 1822 für das gesamte Staatsgebiet Preußens erstellt.\
193
+ \ Diese handgezeichneten Karten dienten als Grundlage für kleinere Kartenwerke\
194
+ \ und markieren den Beginn der topographischen Kartographie in Preußen. Die Karten\
195
+ \ sind heute als hochwertige Drucke verfügbar und bilden historische Landkarten\
196
+ \ ab.\n - fachliche_beschreibung: Die Preußischen Urmesstischblätter werden\
197
+ \ von der Landesvermessung und Geobasisinformation Brandenburg (LGB) erhoben und\
198
+ \ sind Teil der historischen Kartographie des Landes. Das Ministerium für Infrastruktur\
199
+ \ und Landesplanung des Landes Brandenburg hat die fachliche Aufsicht über die\
200
+ \ Erstellung und Bereitstellung dieser historischen Karten.\n - zweck: Die\
201
+ \ Preußischen Urmesstischblätter werden erhoben, um historische topographische\
202
+ \ Informationen über das Staatsgebiet Preußens im 19. Jahrhundert bereitzustellen.\
203
+ \ Sie dienen der Erforschung und Darstellung historischer Landnutzung, Siedlungsstrukturen\
204
+ \ und topographischer Gegebenheiten.\n - einfuehrungsjahr: 2024\n - aktualisierungsfrequenz:\
205
+ \ unbekannt\nDatenbestand hat Datenlieferanten\n - name: Landesvermessung und\
206
+ \ Geobasisinformation Brandenburg (LGB)\nDatenbestand hat Schlagwort\n - name:\
207
+ \ 125.000\n - name: Katasterverwaltung\n - name: Maßstab 1:25.000\n -\
208
+ \ name: historisch\n - name: vermessung\n - name: Topographie\n - name:\
209
+ \ Preußische Urmesstischblätter\n - name: opendata\n - name: bodenbedeckung\n\
210
+ \ - name: karte\n - name: Historische Karten\n - name: Geobasisinformation\n\
211
+ \ - name: Landesvermessung\nDatenbestand hat Kategorie\n - name: Wissenschaft\
212
+ \ und Technologie\n - name: Fischerei\n - name: Umwelt\n - name: Regierung\
213
+ \ und öffentlicher Sektor\n - name: Regionen und Städte\n - name: Landwirtschaft\n\
214
+ \ - name: Forstwirtschaft und Nahrungsmittel\nDatenbestand hat Ministerium\n\
215
+ Ministerium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n\
216
+ \ - kurzbezeichnung: BMI\n - ressorts: Landesvermessung und Geobasisinformation\
217
+ \ Brandenburg (LGB)\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Landesvermessung\
218
+ \ und Geobasisinformation Brandenburg (LGB)\n - kurzbezeichnung: LGB\n -\
219
+ \ themen: Vermessung, Geobasisinformation, Katasterverwaltung\n - ministerium_des_geschaeftsbereichs:\
220
+ \ Ministerium für Infrastruktur und Landesplanung des Landes Brandenburg\n \
221
+ \ - ressort: Landesvermessung, Geoinformation\nDatenbestand hat Gesetze:\nGesetz\n\
222
+ \ - bezeichnung: Gesetz über die Landesvermessung und Geobasisinformation Brandenburg\
223
+ \ (VermGeoG Bbg)\n - kurzbezeichnung: VermGeoG Bbg\nDatenbestand hat Verordnung\n\
224
+ Verordnung\n - bezeichnung: Verordnung über die Geodateninfrastruktur Brandenburg\
225
+ \ (GeoDINV Bbg)\n - kurzbezeichnung: GeoDINV Bbg\nVerordnung\n - bezeichnung:\
226
+ \ Instruction für die topographischen Arbeiten des Königlich Preußischen Generalstabes\
227
+ \ von 1821\n - kurzbezeichnung: Instruction 1821\nVerordnung\n - bezeichnung:\
228
+ \ Erläuterungen zu den Musterblättern für die topographischen Arbeiten des Königlich\
229
+ \ Preußischen Generalstabes\n - kurzbezeichnung: Erläuterungen Musterblätter\n"
230
+ - "\nDatenbestand\n - titel: Kindertagesstätten\n - typ: Fachverfahren\n \
231
+ \ - kurzbeschreibung: Stammdaten aller Kindertagesstätten in Schleswig-Holstein\
232
+ \ mit Informationen wie Einrichtungsnummer, Adresse, pädagogischem Konzept, Trägername\
233
+ \ und Betreuungsalter.\n - allgemeine_beschreibung: Der Datensatz 'Kindertagesstätten'\
234
+ \ enthält die Stammdaten aller Kindertagesstätten, die im KitaPortal Schleswig-Holstein\
235
+ \ enthalten sind. Die Daten umfassen Informationen wie die eindeutige Nummer der\
236
+ \ Einrichtung, die Anschrift, barrierefreien Zugang, pädagogisches Konzept, Trägername,\
237
+ \ Betreuungsalter, Öffnungszeiten und mehr.\n - fachliche_beschreibung: Der\
238
+ \ Datensatz 'Kindertagesstätten' wird vom Ministerium für Soziales, Jugend, Familie,\
239
+ \ Senioren, Integration und Gleichstellung erhoben. Er enthält relevante Informationen\
240
+ \ über die Kindertagesstätten in Schleswig-Holstein und dient der Bereitstellung\
241
+ \ von wichtigen Daten für Eltern, Erziehungsberechtigte und Interessierte.\n \
242
+ \ - zweck: Der Datensatz wird erhoben, um Transparenz über die vorhandenen Kindertagesstätten\
243
+ \ in Schleswig-Holstein zu schaffen und Eltern sowie Erziehungsberechtigten bei\
244
+ \ der Suche nach passenden Betreuungseinrichtungen zu unterstützen.\n - einfuehrungsjahr:\
245
+ \ 2023\n - zeitliche_abdeckung_start: 2022-12-17T00:00:00\n - zeitliche_abdeckung_ende:\
246
+ \ 2023-01-17T00:00:00\nDatenbestand hat Datenlieferanten\n - name: Jugend\n\
247
+ \ - name: Familie\n - name: Senioren\n - name: Ministerium für Soziales\n\
248
+ \ - name: Integration und Gleichstellung\nDatenbestand hat Schlagwort\n \
249
+ \ - name: Barrierefreiheit\n - name: Kindertagespflege\n - name: kindergarten\n\
250
+ \ - name: kindertagestätten\n - name: tagespflege\n - name: Schleswig-Holstein\n\
251
+ \ - name: kitas\n - name: Pädagogisches Konzept\n - name: Kindergarten\n\
252
+ \ - name: Kita\n - name: Trägername\n - name: Betreuungsalter\n -\
253
+ \ name: kindertagespflege\n - name: kindertageseinrichtungen\n - name: Öffnungszeiten\n\
254
+ \ - name: kita\n - name: kindertagesstätte\n - name: Kindertageseinrichtungen\n\
255
+ Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
256
+ Datenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\n\
257
+ Ministerium\n - bezeichnung: Bundesministerium für Familie, Senioren, Frauen\
258
+ \ und Jugend\n - kurzbezeichnung: BMFSFJ\n - ressorts: Ministerium für Soziales,\
259
+ \ Jugend, Familie, Senioren, Integration und Gleichstellung\nDatenbestand hat\
260
+ \ Behörde\nBehoerde\n - bezeichnung: Ministerium für Soziales, Jugend, Familie,\
261
+ \ Senioren, Integration und Gleichstellung\n - kurzbezeichnung: MSJFSIG\n \
262
+ \ - ministerium_des_geschaeftsbereichs: Ministerium für Soziales, Jugend, Familie,\
263
+ \ Senioren, Integration und Gleichstellung des Landes Schleswig-Holstein\n \
264
+ \ - ressort: Soziales\nDatenbestand hat Gesetze:\nGesetz\n - absatz: Teil 2\n\
265
+ \ - bezeichnung: Kindertagesstättengesetz Schleswig-Holstein\n - kurzbezeichnung:\
266
+ \ KiTaG SH\n - paragraph: § 4\nGesetz\n - bezeichnung: KiTa-Qualitätsgesetz\n\
267
+ Datenbestand hat Verordnung\nVerordnung\n - referenz: http://www.schure.de/21130/dvo-nkitag.htm\n\
268
+ \ - bezeichnung: Verordnung zur Durchführung des Niedersächsischen Gesetzes\
269
+ \ über Kindertagesstätten und Kindertagespflege\n - kurzbezeichnung: DVO-NKiTaG\n"
270
+ - source_sentence: In welchen Datenbeständen sind statistische Auswertungen aus dem
271
+ Sterberegister von Roetgen für 2020 enthalten gemäß dem Gesetz zum Schutz vor
272
+ Luftverunreinigung, Geräuschen?
273
+ sentences:
274
+ - "\nDatenbestand\n - titel: Datenbanken Beschäftigungsstatistik\n - typ:\
275
+ \ Fachverfahren\n - kurzbeschreibung: Monatliche Beschäftigtenkennzahlen nach\
276
+ \ soziodemographischen Merkmalen und Berufen in Deutschland.\n - allgemeine_beschreibung:\
277
+ \ Die Datenbanken Beschäftigungsstatistik enthalten monatliche Beschäftigtenkennzahlen\
278
+ \ nach soziodemographischen Merkmalen sowie der Klassifikation der Berufe. Die\
279
+ \ Datenbanken werden quartalsweise mit Monatsdaten aktualisiert und bieten einen\
280
+ \ umfassenden Überblick über die Beschäftigungssituation in Deutschland.\n \
281
+ \ - fachliche_beschreibung: Die Datenbanken Beschäftigungsstatistik werden von\
282
+ \ der Statistik der Bundesagentur für Arbeit geführt. Sie bieten detaillierte\
283
+ \ Informationen über die Beschäftigungssituation in Deutschland und werden quartalsweise\
284
+ \ mit aktuellen Monatsdaten aktualisiert. Die Daten dienen als Grundlage für Analysen\
285
+ \ zur Entwicklung des Arbeitsmarktes und der Beschäftigungsdynamik. Zu den relevanten\
286
+ \ Behörden gehören die Bundesagentur für Arbeit und das Bundesministerium für\
287
+ \ Arbeit und Soziales.\n - zweck: Der Datensatz wird erhoben, um detaillierte\
288
+ \ Einblicke in die Beschäftigungssituation in Deutschland zu ermöglichen. Er dient\
289
+ \ der Analyse von Trends in der Beschäftigung nach verschiedenen Merkmalen wie\
290
+ \ Alter, Geschlecht, Beruf und Staatsangehörigkeit.\nDatenbestand hat Datenlieferanten\n\
291
+ \ - name: Statistik der Bundesagentur für Arbeit\nDatenbestand hat Schlagwort\n\
292
+ \ - name: Arbeitszeit\n - name: Ausschließlich geringfügig Beschäftigte\n\
293
+ \ - name: Staatsangehörigkeit\n - name: Sozialversicherungspflichtig beschäftigte\
294
+ \ Auszubildende\n - name: Geschlecht\n - name: Beschäftigung\n - name:\
295
+ \ Berufe\n - name: Beschäftigte\n - name: Sozialversicherungspflichtig Beschäftigte\n\
296
+ \ - name: Geringfügig Beschäftigte\n - name: Geringfügig Beschäftigte im\
297
+ \ Nebenjob\n - name: Alter\nDatenbestand hat Kategorie\n - name: Wirtschaft\
298
+ \ und Finanzen\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat politische\
299
+ \ Ebenen\n - name: Bundesebene\nDatenbestand hat geografische Abdeckung\n \
300
+ \ - name: Kreise\n - name: Deutschland\n - name: Länder\nDatenbestand\
301
+ \ hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium für Arbeit\
302
+ \ und Soziales\n - kurzbezeichnung: BMAS\n - ressorts: Statistik der Bundesagentur\
303
+ \ für Arbeit\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesagentur\
304
+ \ für Arbeit (BA)\n - kurzbezeichnung: BA\n - themen: Arbeitsmarkt, Beschäftigungsstatistik,\
305
+ \ Ressortstatistiken\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
306
+ \ für Arbeit und Soziales\n - ressort: Bundesagentur für Arbeit\nDatenbestand\
307
+ \ hat Gesetze:\nGesetz\n - bezeichnung: Verdienststatistikgesetz\n - paragraph:\
308
+ \ § 4\nDatenbestand hat Verordnung\nVerordnung\n - referenz: SR 431.012.1\n\
309
+ \ - bezeichnung: Verordnung vom 30. Juni 1993 über statistische Erhebungen\n\
310
+ Verordnung\n - referenz: Entwurf eines Gesetzes zur Einführung eines Registerzensus\n\
311
+ \ - bezeichnung: Registerzensusgesetz\n"
312
+ - "\nDatenbestand\n - titel: Wahllokale in Lübeck zur Europawahl 2024\n -\
313
+ \ typ: Fachverfahren\n - kurzbeschreibung: Georeferenzierter Datensatz der\
314
+ \ Wahllokale in Lübeck zur Europawahl 2024.\n - allgemeine_beschreibung: Der\
315
+ \ Datensatz enthält georeferenzierte Informationen zu den Wahllokalen in der Hansestadt\
316
+ \ Lübeck für die Europawahl am 9. Juni 2024. Enthalten sind Angaben wie Wahlbezirksnummer,\
317
+ \ Name des Wahllokals, Adresse, Hinweise zum Wahllokal, Barrierefreiheit und Koordinaten.\n\
318
+ \ - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung der\
319
+ \ Hansestadt Lübeck bereitgestellt und enthält Informationen zu den Wahllokalen,\
320
+ \ die für die Europawahl am 9. Juni 2024 relevant sind. Die Daten werden im Fachverfahren\
321
+ \ der Kommunalverwaltung verwaltet und dienen der Unterstützung des Wahlprozesses\
322
+ \ in Lübeck.\n - zweck: Der Datensatz wird erhoben, um den Bürgern von Lübeck\
323
+ \ die Standorte der Wahllokale für die Europawahl 2024 zugänglich zu machen und\
324
+ \ ihnen eine barrierefreie Teilnahme zu ermöglichen.\n - einfuehrungsjahr:\
325
+ \ 2024\n - zeitliche_abdeckung_start: 2024-06-09T00:00:00\n - zeitliche_abdeckung_ende:\
326
+ \ 2024-06-09T00:00:00\nDatenbestand hat Datenlieferanten\n - name: Hansestadt\
327
+ \ Lübeck\nDatenbestand hat Schlagwort\n - name: barrierefreiheit\n - name:\
328
+ \ wahlbezirk\n - name: wahllokal\n - name: wahl\n - name: stimmbezirk\n\
329
+ Datenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\nDatenbestand\
330
+ \ hat Ministerium\nMinisterium\n - bezeichnung: Hansestadt Lübeck\nDatenbestand\
331
+ \ hat Behörde\nBehoerde\n - bezeichnung: Hansestadt Lübeck\n - kurzbezeichnung:\
332
+ \ Stadtverwaltung\n - themen: Stadtverwaltung, Kommunalverwaltung, Bürgerservice\n\
333
+ \ - ministerium_des_geschaeftsbereichs: Innenministerium des Landes Schleswig-Holstein\n\
334
+ \ - ressort: Kommunale Verwaltung\nDatenbestand hat Gesetze:\nGesetz\n -\
335
+ \ bezeichnung: Europawahlgesetz\nDatenbestand hat Verordnung\nVerordnung\n \
336
+ \ - bezeichnung: Datenschutzgrundverordnung (DSGVO)\n - kurzbezeichnung: DSGVO\n\
337
+ Verordnung\n - bezeichnung: Europawahlordnung\n"
338
+ - "\nDatenbestand\n - titel: Auswertungen aus dem Sterberegister der Gemeinde\
339
+ \ Roetgen\n - typ: Fachverfahren\n - kurzbeschreibung: Auswertungen aus\
340
+ \ dem Sterberegister der Gemeinde Roetgen, Jahr 2020.\n - allgemeine_beschreibung:\
341
+ \ Der Datensatz enthält Auswertungen aus dem Sterberegister der Gemeinde Roetgen,\
342
+ \ speziell aus dem Jahr 2020. Die Daten werden jährlich aktualisiert und sind\
343
+ \ über das GovData Portal verfügbar.\n - fachliche_beschreibung: Der Datensatz\
344
+ \ wird von der Stadt Aachen bereitgestellt und enthält statistische Auswertungen\
345
+ \ aus dem Sterberegister der Gemeinde Roetgen. Die Daten dienen der Analyse von\
346
+ \ Sterbefällen in der Gemeinde und werden unter der fachlichen Aufsicht des Bundesministeriums\
347
+ \ des Innern und für Heimat veröffentlicht.\n - zweck: Der Datensatz wird erhoben,\
348
+ \ um Einblicke in Sterbefälle und statistische Auswertungen im Bereich der Gemeinde\
349
+ \ Roetgen zu ermöglichen.\n - einfuehrungsjahr: 2024\nDatenbestand hat Datenlieferanten\n\
350
+ \ - name: Aachen\nDatenbestand hat Schlagwort\n - name: sterbefälle\n \
351
+ \ - name: auswertungen\n - name: Sterbefälle\n - name: Auswertungen\n \
352
+ \ - name: GovData Portal\n - name: Statistiken\n - name: roetgen\n \
353
+ \ - name: Jahresbericht\n - name: Gemeinde Roetgen\nDatenbestand hat Kategorie\n\
354
+ \ - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n\
355
+ \ - name: Bevölkerung und Gesellschaft\nDatenbestand hat Ministerium\nMinisterium\n\
356
+ \ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
357
+ \ BMI\n - ressorts: Stadt Aachen, StädteRegion Aachen, Rathaus Aachen\nDatenbestand\
358
+ \ hat Behörde\nBehoerde\n - bezeichnung: Stadt Aachen\n - kurzbezeichnung:\
359
+ \ Stadtverwaltung Aachen\n - ministerium_des_geschaeftsbereichs: Ministerium\
360
+ \ des Innern\n - ressort: Kommunales\nDatenbestand hat Gesetze:\nGesetz\n \
361
+ \ - bezeichnung: Gesetz zum Schutz vor Luftverunreinigung, Geräuschen\n -\
362
+ \ paragraph: § 5 Abs. 1; 7 Abs. 1; 9 Abs. 3; 10 Abs. 4\nDatenbestand hat Verordnung\n\
363
+ Verordnung\n - referenz: https://www.roetgen.de/wp-content/uploads/2018/06/Ordnungsbeh%C3%B6rdliche-Verordnung-%C3%BCber-die-Aufrechterhaltung-der-%C3%B6ffentlichen-Sicherheit-und-Ordnung.pdf\n\
364
+ \ - bezeichnung: Ordnungsbehördliche Verordnung - Gemeinde Roetgen\nVerordnung\n\
365
+ \ - referenz: https://buergerportal.roetgen.de/detail/-/vr-bis-detail/dienstleistung/659/show\n\
366
+ \ - bezeichnung: Personenstandsurkunden Aufbewahrungsfristen\n"
367
+ - source_sentence: Welche Datenquellen des BStU bieten Einblicke in die Antragszahlen
368
+ und Verwendungszwecke für Stasi-Unterlagen?
369
+ sentences:
370
+ - "\nDatenbestand\n - titel: Entwicklung der Antragszahlen nach Verwendungszweck\n\
371
+ \ - typ: Fachverfahren\n - kurzbeschreibung: Anzahl der Anträge und Ersuchen\
372
+ \ an die Stasi-Unterlagen-Behörde (BStU) nach Verwendungszweck und Jahren gemäß\
373
+ \ Stasi-Unterlagen-Gesetz (StUG).\n - allgemeine_beschreibung: Der Datensatz\
374
+ \ bietet eine Übersicht über die Anzahl der an die Stasi-Unterlagen-Behörde (BStU)\
375
+ \ gestellten Anträge und Ersuchen, aufgeschlüsselt nach Jahren und den jeweiligen\
376
+ \ Verwendungszwecken gemäß Stasi-Unterlagen-Gesetz (StUG). Die Daten werden vom\
377
+ \ Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen\
378
+ \ Deutschen Demokratischen Republik (BStU) bereitgestellt und sind über das FITKO\
379
+ \ (Föderale IT-Kooperation) – GovData Portal verfügbar.\n - fachliche_beschreibung:\
380
+ \ Der Datensatz wird vom Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes\
381
+ \ der ehemaligen Deutschen Demokratischen Republik (BStU) bereitgestellt. Die\
382
+ \ Behörde ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt\
383
+ \ und hat den Auftrag, die Unterlagen des ehemaligen Staatssicherheitsdienstes\
384
+ \ der DDR zu sichern, zu erforschen und der Öffentlichkeit zugänglich zu machen.\
385
+ \ Die Antragszahlen geben Einblicke in das Interesse an der Aufarbeitung der Stasi-Unterlagen\
386
+ \ und dienen der historischen Forschung sowie der Erinnerungskultur.\n - zweck:\
387
+ \ Der Datensatz wird erhoben, um Transparenz über die Anzahl und die Verwendungszwecke\
388
+ \ der gestellten Anträge und Ersuchen an die Stasi-Unterlagen-Behörde zu schaffen.\
389
+ \ Dies dient der Aufarbeitung von Unterlagen des Staatssicherheitsdienstes der\
390
+ \ ehemaligen DDR und ermöglicht es Forschern, Historikern und der interessierten\
391
+ \ Öffentlichkeit Einblicke in die Aktivitäten der Stasi zu erhalten.\n - einfuehrungsjahr:\
392
+ \ 2014\nDatenbestand hat Datenlieferanten\n - name: Der Bundesbeauftragte für\
393
+ \ die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratsichen\
394
+ \ Republik (BStU)\nDatenbestand hat Schlagwort\n - name: anträge\n - name:\
395
+ \ antrag\n - name: stug\n - name: staatssicherheit\n - name: ersuchen\n\
396
+ \ - name: aufarbeitung\n - name: auskunft\n - name: stasi\n - name:\
397
+ \ ddr\n - name: akteneinsicht\n - name: mfs\n - name: stasi-unterlagen\n\
398
+ Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
399
+ \ - name: Wissenschaft und Technologie\nDatenbestand hat Ministerium\nMinisterium\n\
400
+ \ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
401
+ \ BMI\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Der Bundesbeauftragte\
402
+ \ für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen\
403
+ \ Republik (BStU)\n - kurzbezeichnung: BStU\n - themen: Staatssicherheitsdienst,\
404
+ \ Unterlagen, DDR\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
405
+ \ des Innern, für Bau und Heimat\n - ressort: Bundesbeauftragter für die Stasi-Unterlagen\n\
406
+ Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Stasi-Unterlagen-Gesetz\n\
407
+ \ - kurzbezeichnung: StUG\nDatenbestand hat Verordnung\nVerordnung\n - referenz:\
408
+ \ https://www.bundesgesundheitsministerium.de/fileadmin/Dateien/3_Downloads/Gesetze_und_Verordnungen/GuV/D/VO_Datentransparenzverordnung.pdf\n\
409
+ \ - bezeichnung: VO_Datentransparenzverordnung\n"
410
+ - "\nDatenbestand\n - titel: UAV-Lärmmessdaten des RauMoLeS-Projekts\n - typ:\
411
+ \ Fachverfahren\n - kurzbeschreibung: Lärmmessdaten von UAVs im RauMoLeS-Projekt,\
412
+ \ inklusive Positionen der Messmikrofone und UAVs, Propellerdrehzahlen und elektrische\
413
+ \ Gesamtsystemleistung.\n - allgemeine_beschreibung: Der Datensatz enthält\
414
+ \ Lärmmessdaten von UAVs im Rahmen des RauMoLeS-Projekts. Es gibt Messdaten für\
415
+ \ das UAV \"Manta Ray\" und drei verschiedene Konfigurationen des UAV \"Minitalon\"\
416
+ . Die Daten umfassen die Positionen der Messmikrofone und der UAVs, sowie Propellerdrehzahlen\
417
+ \ und die elektrische Gesamtsystemleistung der UAVs.\n - fachliche_beschreibung:\
418
+ \ Der Datensatz wird vom Lehrstuhl für Luftfahrtsysteme der Technischen Universität\
419
+ \ München und der Phoenix-Wings GmbH bereitgestellt. Er dient der Erfassung und\
420
+ \ Analyse von Lärmemissionen von UAVs, insbesondere im Bereich der Luftfahrt.\
421
+ \ Das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) ist die\
422
+ \ zuständige Behörde für Luftfahrtthemen.\n - zweck: Der Datensatz wurde erhoben,\
423
+ \ um Lärmdaten von UAVs zu sammeln und zu analysieren, insbesondere im Hinblick\
424
+ \ auf die Auswirkungen auf die Umwelt und die Bevölkerung. Die Daten dienen der\
425
+ \ Forschung und Entwicklung im Bereich der Luftfahrt.\n - einfuehrungsjahr:\
426
+ \ 2020\nDatenbestand hat Datenlieferanten\n - name: Prof. Schaller UmweltConsult\
427
+ \ GmbH\n - name: 2020\n - name: 2020 Flugmessdaten: Phoenix-Wings GmbH\n\
428
+ \ - name: Technische Universität München\n - name: Lärmdaten: Lehrstuhl\
429
+ \ für Luftfahrtsysteme\nDatenbestand hat Schlagwort\n - name: Minitalon\n \
430
+ \ - name: Manta Ray\n - name: mcloud_category_aviation\n - name: mfund-projekt-raumoles\n\
431
+ \ - name: Propellerdrehzahlen\n - name: mcloud_idd46c56b5-c70e-4fc9-bd54-b62d82db146e\n\
432
+ \ - name: UAVs\n - name: Gesamtsystemleistung\n - name: Luftfahrt\n \
433
+ \ - name: Lärmdaten\n - name: RauMoLeS-Projekt\nDatenbestand hat Kategorie\n\
434
+ \ - name: Verkehr\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
435
+ \ Bundesministerium für Verkehr und digitale Infrastruktur\n - kurzbezeichnung:\
436
+ \ BMDV\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesministerium\
437
+ \ für Verkehr und digitale Infrastruktur\n - kurzbezeichnung: BMVI\n - themen:\
438
+ \ Lärmdaten, Flugmessdaten\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
439
+ \ für Verkehr und digitale Infrastruktur\n - ressort: Luftfahrt\nDatenbestand\
440
+ \ hat Gesetze:\nGesetz\n - bezeichnung: Bundes-Immissionsschutzgesetz\n \
441
+ \ - kurzbezeichnung: BImSchG\n - paragraph: 34\nDatenbestand hat Verordnung\n\
442
+ Verordnung\n - referenz: https://www.mcloud.de/export/csv/datasets?page=1&pageSize=198&sortOrder=desc&sortField=latest&aggs=categories%3Aaviation\n\
443
+ \ - bezeichnung: Verordnung zur Durchführung des Bundes-Immissionsschutzgesetzes\n\
444
+ \ - kurzbezeichnung: 34. BImSchV\n"
445
+ - "\nDatenbestand\n - titel: Kindertageseinrichtungen in Neckarsulm\n - typ:\
446
+ \ Fachverfahren\n - kurzbeschreibung: Standorte, Öffnungszeiten und weitere\
447
+ \ Infos zu Kindertageseinrichtungen in Neckarsulm.\n - allgemeine_beschreibung:\
448
+ \ Der Datensatz enthält Informationen zu den Standorten, Öffnungszeiten und weiteren\
449
+ \ Details der Kindertageseinrichtungen in Neckarsulm.\n - fachliche_beschreibung:\
450
+ \ Der Datensatz wird vom Amt für Stadtentwicklung und Gebäudewirtschaft, Stadtplanung\
451
+ \ und GIS der Stadt Neckarsulm bereitgestellt. Er enthält relevante Informationen\
452
+ \ zu den Kindertageseinrichtungen in der Stadt, um Transparenz zu schaffen und\
453
+ \ Eltern bei der Suche nach einer geeigneten Einrichtung zu unterstützen.\n \
454
+ \ - zweck: Der Datensatz wird erhoben, um Eltern und Erziehungsberechtigten einen\
455
+ \ Überblick über die verfügbaren Kindertageseinrichtungen in Neckarsulm zu geben\
456
+ \ und sie bei der Auswahl einer passenden Einrichtung zu unterstützen.\n -\
457
+ \ einfuehrungsjahr: 2023\nDatenbestand hat Datenlieferanten\n - name: Stadtplanung\
458
+ \ und GIS\n - name: Amt für Stadtentwicklung und Gebäudewirtschaft\nDatenbestand\
459
+ \ hat Schlagwort\n - name: Kindertageseinrichtung\n - name: GIS\n - name:\
460
+ \ Stadtplanung\n - name: Neckarsulm\n - name: kindertageseinrichtung\n \
461
+ \ - name: Gebäudewirtschaft\n - name: Kita\n - name: Öffnungszeiten\n\
462
+ \ - name: kita\n - name: Standorte\n - name: Stadtentwicklung\nDatenbestand\
463
+ \ hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\nDatenbestand\
464
+ \ hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium für Wohnen,\
465
+ \ Stadtentwicklung und Bauwesen\n - kurzbezeichnung: BMWSB\nDatenbestand hat\
466
+ \ Behörde\nBehoerde\n - bezeichnung: Amt für Stadtentwicklung und Gebäudewirtschaft,\
467
+ \ Stadtplanung und GIS\n - kurzbezeichnung: Stadtentwicklung und Bauamt\n \
468
+ \ - themen: Stadtentwicklung, Gebäudewirtschaft, Stadtplanung, GIS\n - ministerium_des_geschaeftsbereichs:\
469
+ \ Bundesministerium des Innern, für Bau und Heimat\n - ressort: Stadtentwicklung,\
470
+ \ Bau und Wohnungswesen\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung:\
471
+ \ Gesetz zur Bildung, Erziehung und Betreuung von Kindern in Kindertageseinrichtungen\
472
+ \ und in Tagespflege (BayKiBiG)\n - kurzbezeichnung: BayKiBiG\nGesetz\n \
473
+ \ - bezeichnung: Kindertagesstättengesetz (KitaG)\n - kurzbezeichnung: KitaG\n\
474
+ Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.landesrecht-bw.de/bsbw/document/jlr-KiTaVBWV6P1\n\
475
+ \ - bezeichnung: Verordnung des Kultusministeriums über den Mindestpersonalschlüssel\
476
+ \ und die Personalfortbildung in Kindergärten und Tageseinrichtungen mit altersgemischten\
477
+ \ Gruppen (KiTaVO)\n - kurzbezeichnung: KiTaVO\nVerordnung\n - referenz:\
478
+ \ https://www.bmfsfj.de/bmfsfj/themen/familie/kinderbetreuung/fuer-gute-kinderbetreuung-bundesweit-das-kita-qualitaetsgesetz-209046\n\
479
+ \ - bezeichnung: KiTa-Qualitätsgesetz\n - kurzbezeichnung: KiTa-Qualitätsgesetz\n"
480
+ - source_sentence: Welche Datenbestände dokumentieren die Fachaufsicht des BMI über
481
+ Kinderbetreuungseinrichtungen in der Stadt Oberhof?
482
+ sentences:
483
+ - "\nDatenbestand\n - titel: Luftbild 2002\n - typ: Fachverfahren\n - kurzbeschreibung:\
484
+ \ Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und\
485
+ \ Umgebung von März und April 2002.\n - allgemeine_beschreibung: Der Datensatz\
486
+ \ 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt\
487
+ \ Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16\
488
+ \ Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n - fachliche_beschreibung:\
489
+ \ Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt,\
490
+ \ speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer\
491
+ \ Luftbilder für die Öffentlichkeit.\n - zweck: Der Datensatz wird erhoben,\
492
+ \ um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung\
493
+ \ aus dem Jahr 2002 bereitzustellen.\n - einfuehrungsjahr: 2017\n - zeitliche_abdeckung_start:\
494
+ \ 2002-03-01T00:00:00+01:00\n - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\n\
495
+ Datenbestand hat Datenlieferanten\n - name: Hanse- und Universitätsstadt Rostock\n\
496
+ Datenbestand hat Schlagwort\n - name: luftbild\n - name: Historisch\n \
497
+ \ - name: Digitales Orthophoto\n - name: 2002\n - name: Bodenauflösung\n\
498
+ \ - name: Rostock\n - name: Luftbild\n - name: Hanse- und Universitätsstadt\n\
499
+ Datenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\n \
500
+ \ - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n - name:\
501
+ \ Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n\
502
+ \ - name: Rostock\n - name: Hanse- und Universitätsstadt\nDatenbestand hat\
503
+ \ Sprache\n - name: Deutsch\nDatenbestand hat geografische Abdeckung\n -\
504
+ \ name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n -\
505
+ \ bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
506
+ \ BMI\n - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat\
507
+ \ Behörde\nBehoerde\n - bezeichnung: Hanse- und Universitätsstadt Rostock\n\
508
+ \ - kurzbezeichnung: Rostock\n - themen: Kommunalverwaltung, Stadtentwicklung,\
509
+ \ Öffentliche Ordnung\n - ministerium_des_geschaeftsbereichs: Ministerium für\
510
+ \ Inneres und Europa Mecklenburg-Vorpommern\n - ressort: Kommunalaufsicht\n\
511
+ Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Bundesdatenschutzgesetz\n\
512
+ \ - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n - referenz:\
513
+ \ https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n\
514
+ \ - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und\
515
+ \ Ausführung von Luftbildern\nVerordnung\n - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n\
516
+ \ - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n"
517
+ - "\nDatenbestand\n - titel: Bebauungspläne\n - typ: Fachverfahren\n -\
518
+ \ kurzbeschreibung: Der Datensatz enthält Bebauungspläne der Ortsgemeinde Wintrich,\
519
+ \ die die Nutzung von Grundstücken in bestimmten Gebieten regeln.\n - allgemeine_beschreibung:\
520
+ \ Der Datensatz umfasst Bebauungspläne, die von der Ortsgemeinde Wintrich bereitgestellt\
521
+ \ werden. Bebauungspläne sind Satzungen, die von Gemeinden beschlossen werden\
522
+ \ und die beabsichtigte Bodennutzung in einem bestimmten Gebiet regeln.\n -\
523
+ \ fachliche_beschreibung: Die Ortsgemeinde Wintrich stellt Bebauungspläne bereit,\
524
+ \ die im Rahmen der Bauleitplanung gemäß dem Baugesetzbuch (BauGB) erstellt werden.\
525
+ \ Die Bebauungspläne werden als Satzungen von der Gemeinde beschlossen und regeln\
526
+ \ die Art der baulichen Nutzung sowie die städtebauliche Entwicklung in einem\
527
+ \ definierten Gebiet. Zuständig für die Verwaltung und Bereitstellung der Bebauungspläne\
528
+ \ ist die Kommunalverwaltung der Ortsgemeinde Wintrich.\n - zweck: Die Bebauungspläne\
529
+ \ dienen dazu, die bauliche und sonstige Nutzung von Grundstücken in einem definierten\
530
+ \ Gebiet zu regeln. Sie legen fest, welche Art von Bebauung zulässig ist und dienen\
531
+ \ der städtebaulichen Entwicklung und Ordnung.\n - einfuehrungsjahr: 2022\n\
532
+ Datenbestand hat Datenlieferanten\n - name: Ortsgemeinde Wintrich\nDatenbestand\
533
+ \ hat Schlagwort\n - name: Ortsgemeinde Wintrich\n - name: städtebauliche\
534
+ \ Entwicklung\n - name: Bebauungspläne\n - name: Baugesetzbuch\n - name:\
535
+ \ Bauleitplanung\n - name: Satzungen\nDatenbestand hat Kategorie\n - name:\
536
+ \ Regierung und öffentlicher Sektor\nDatenbestand hat Sprache\n - name: http://publications.europa.eu/resource/authority/language/GER\n\
537
+ Datenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium\
538
+ \ des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Ortsgemeinde\
539
+ \ Wintrich\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Ortsgemeinde\
540
+ \ Wintrich\n - kurzbezeichnung: Ortsgemeinde Wintrich\n - themen: Gemeindeverwaltung,\
541
+ \ Ortsrecht, Bürgerdienste\n - ministerium_des_geschaeftsbereichs: Ministerium\
542
+ \ des Innern, für Sport und Infrastruktur Rheinland-Pfalz\n - ressort: Kommunalverwaltung\n\
543
+ Datenbestand hat Gesetze:\nGesetz\n - absatz: (1) Die Gemeinde beschließt den\
544
+ \ Bebauungsplan als Satzung. (2) Bebauungspläne nach § 8 Absatz ...\n - bezeichnung:\
545
+ \ Baugesetzbuch (BauGB)\n - kurzbezeichnung: BauGB\n - paragraph: § 10\n\
546
+ Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.bmwsb.bund.de/SharedDocs/gesetzgebungsverfahren/Webs/BMWSB/DE/digitalisierung-im-bauleitverfahren.html\n\
547
+ \ - bezeichnung: Entwurf eines Gesetzes zur Stärkung der Digitalisierung\n\
548
+ \ - kurzbezeichnung: Digitalisierungsgesetz\nVerordnung\n - referenz: https://recht.nrw.de/lmi/owa/br_bes_text?print=1&anw_nr=1&gld_nr=%202&ugl_nr=2311&val=2493&ver=7&aufgehoben=J&keyword=&bes_id=2493&show_preview=1\n\
549
+ \ - bezeichnung: Verordnung zur Änderung der Baunutzungsverordnung\n - kurzbezeichnung:\
550
+ \ BauNVO\n"
551
+ - "\nDatenbestand\n - titel: Kindertagesstätten der Stadt Oberhof\n - typ:\
552
+ \ Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen\
553
+ \ der Stadt Oberhof.\n - allgemeine_beschreibung: Der Datensatz zeigt die Standorte\
554
+ \ von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen\
555
+ \ Sekundärdatenbestand.\n - fachliche_beschreibung: Der Datensatz wird von\
556
+ \ der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen\
557
+ \ in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof\
558
+ \ und das Thüringer Ministerium für Inneres und Kommunales.\n - zweck: Der\
559
+ \ Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren\
560
+ \ Kindertagesstätten und Kinderkrippen bereitzustellen.\n - aktualisierungsfrequenz:\
561
+ \ http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
562
+ Datenbestand hat Datenlieferanten\n - name: Stadt Oberhof\nDatenbestand hat\
563
+ \ Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n -\
564
+ \ name: kindertagesstätten\n - name: kindergarten\n - name: kinderbetreuung\n\
565
+ \ - name: thüringen\n - name: opendata\n - name: kinderkrippe\n -\
566
+ \ name: kita\nDatenbestand hat Kategorie\n - name: Bildung\n - name: Kultur\
567
+ \ und Sport\n - name: Regierung und öffentlicher Sektor\n - name: Regionen\
568
+ \ und Städte\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n\
569
+ \ - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
570
+ \ Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n \
571
+ \ - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung:\
572
+ \ Stadtverwaltung Oberhof\n - kurzbezeichnung: Stadtverwaltung\n - themen:\
573
+ \ Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n - ministerium_des_geschaeftsbereichs:\
574
+ \ Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalverwaltung\n\
575
+ Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n\
576
+ \ - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n \
577
+ \ - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n\
578
+ \ - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle\
579
+ \ für den automatisierten Datenaustausch\nVerordnung\n - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n\
580
+ \ - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung\
581
+ \ einer erfüllenden Gemeinde\n"
582
+ model-index:
583
+ - name: SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
584
+ results:
585
+ - task:
586
+ type: information-retrieval
587
+ name: Information Retrieval
588
+ dataset:
589
+ name: dim 512
590
+ type: dim_512
591
+ metrics:
592
+ - type: cosine_accuracy@1
593
+ value: 0.40814867762687634
594
+ name: Cosine Accuracy@1
595
+ - type: cosine_accuracy@3
596
+ value: 0.6311651179413867
597
+ name: Cosine Accuracy@3
598
+ - type: cosine_accuracy@5
599
+ value: 0.7176554681915654
600
+ name: Cosine Accuracy@5
601
+ - type: cosine_accuracy@10
602
+ value: 0.8077197998570408
603
+ name: Cosine Accuracy@10
604
+ - type: cosine_precision@1
605
+ value: 0.40814867762687634
606
+ name: Cosine Precision@1
607
+ - type: cosine_precision@3
608
+ value: 0.21038837264712884
609
+ name: Cosine Precision@3
610
+ - type: cosine_precision@5
611
+ value: 0.14353109363831304
612
+ name: Cosine Precision@5
613
+ - type: cosine_precision@10
614
+ value: 0.08077197998570407
615
+ name: Cosine Precision@10
616
+ - type: cosine_recall@1
617
+ value: 0.40814867762687634
618
+ name: Cosine Recall@1
619
+ - type: cosine_recall@3
620
+ value: 0.6311651179413867
621
+ name: Cosine Recall@3
622
+ - type: cosine_recall@5
623
+ value: 0.7176554681915654
624
+ name: Cosine Recall@5
625
+ - type: cosine_recall@10
626
+ value: 0.8077197998570408
627
+ name: Cosine Recall@10
628
+ - type: cosine_ndcg@10
629
+ value: 0.6045190659045919
630
+ name: Cosine Ndcg@10
631
+ - type: cosine_mrr@10
632
+ value: 0.5398677626876347
633
+ name: Cosine Mrr@10
634
+ - type: cosine_map@100
635
+ value: 0.5472345393824497
636
+ name: Cosine Map@100
637
+ ---
638
+
639
+ # SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
640
+
641
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [mixedbread-ai/deepset-mxbai-embed-de-large-v1](https://huggingface.co/mixedbread-ai/deepset-mxbai-embed-de-large-v1). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
642
+
643
+ ## Model Details
644
+
645
+ ### Model Description
646
+ - **Model Type:** Sentence Transformer
647
+ - **Base model:** [mixedbread-ai/deepset-mxbai-embed-de-large-v1](https://huggingface.co/mixedbread-ai/deepset-mxbai-embed-de-large-v1) <!-- at revision fe450620a047ac704e100d84aebe7cd3fc137021 -->
648
+ - **Maximum Sequence Length:** 512 tokens
649
+ - **Output Dimensionality:** 1024 tokens
650
+ - **Similarity Function:** Cosine Similarity
651
+ <!-- - **Training Dataset:** Unknown -->
652
+ <!-- - **Language:** Unknown -->
653
+ <!-- - **License:** Unknown -->
654
+
655
+ ### Model Sources
656
+
657
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
658
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
659
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
660
+
661
+ ### Full Model Architecture
662
+
663
+ ```
664
+ SentenceTransformer(
665
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
666
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
667
+ (2): Normalize()
668
+ )
669
+ ```
670
+
671
+ ## Usage
672
+
673
+ ### Direct Usage (Sentence Transformers)
674
+
675
+ First install the Sentence Transformers library:
676
+
677
+ ```bash
678
+ pip install -U sentence-transformers
679
+ ```
680
+
681
+ Then you can load this model and run inference.
682
+ ```python
683
+ from sentence_transformers import SentenceTransformer
684
+
685
+ # Download from the 🤗 Hub
686
+ model = SentenceTransformer("sentence_transformers_model_id")
687
+ # Run inference
688
+ sentences = [
689
+ 'Welche Datenbestände dokumentieren die Fachaufsicht des BMI über Kinderbetreuungseinrichtungen in der Stadt Oberhof?',
690
+ '\nDatenbestand\n - titel: Kindertagesstätten der Stadt Oberhof\n - typ: Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof.\n - allgemeine_beschreibung: Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen Sekundärdatenbestand.\n - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof und das Thüringer Ministerium für Inneres und Kommunales.\n - zweck: Der Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren Kindertagesstätten und Kinderkrippen bereitzustellen.\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\nDatenbestand hat Datenlieferanten\n - name: Stadt Oberhof\nDatenbestand hat Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n - name: kindertagesstätten\n - name: kindergarten\n - name: kinderbetreuung\n - name: thüringen\n - name: opendata\n - name: kinderkrippe\n - name: kita\nDatenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Stadtverwaltung Oberhof\n - kurzbezeichnung: Stadtverwaltung\n - themen: Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n - ministerium_des_geschaeftsbereichs: Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalverwaltung\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle für den automatisierten Datenaustausch\nVerordnung\n - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung einer erfüllenden Gemeinde\n',
691
+ "\nDatenbestand\n - titel: Luftbild 2002\n - typ: Fachverfahren\n - kurzbeschreibung: Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002.\n - allgemeine_beschreibung: Der Datensatz 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16 Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt, speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer Luftbilder für die Öffentlichkeit.\n - zweck: Der Datensatz wird erhoben, um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung aus dem Jahr 2002 bereitzustellen.\n - einfuehrungsjahr: 2017\n - zeitliche_abdeckung_start: 2002-03-01T00:00:00+01:00\n - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\nDatenbestand hat Datenlieferanten\n - name: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Schlagwort\n - name: luftbild\n - name: Historisch\n - name: Digitales Orthophoto\n - name: 2002\n - name: Bodenauflösung\n - name: Rostock\n - name: Luftbild\n - name: Hanse- und Universitätsstadt\nDatenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n - name: Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n - name: Rostock\n - name: Hanse- und Universitätsstadt\nDatenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat geografische Abdeckung\n - name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Hanse- und Universitätsstadt Rostock\n - kurzbezeichnung: Rostock\n - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung\n - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern\n - ressort: Kommunalaufsicht\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Bundesdatenschutzgesetz\n - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n - referenz: https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und Ausführung von Luftbildern\nVerordnung\n - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n",
692
+ ]
693
+ embeddings = model.encode(sentences)
694
+ print(embeddings.shape)
695
+ # [3, 1024]
696
+
697
+ # Get the similarity scores for the embeddings
698
+ similarities = model.similarity(embeddings, embeddings)
699
+ print(similarities.shape)
700
+ # [3, 3]
701
+ ```
702
+
703
+ <!--
704
+ ### Direct Usage (Transformers)
705
+
706
+ <details><summary>Click to see the direct usage in Transformers</summary>
707
+
708
+ </details>
709
+ -->
710
+
711
+ <!--
712
+ ### Downstream Usage (Sentence Transformers)
713
+
714
+ You can finetune this model on your own dataset.
715
+
716
+ <details><summary>Click to expand</summary>
717
+
718
+ </details>
719
+ -->
720
+
721
+ <!--
722
+ ### Out-of-Scope Use
723
+
724
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
725
+ -->
726
+
727
+ ## Evaluation
728
+
729
+ ### Metrics
730
+
731
+ #### Information Retrieval
732
+ * Dataset: `dim_512`
733
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
734
+
735
+ | Metric | Value |
736
+ |:--------------------|:-----------|
737
+ | cosine_accuracy@1 | 0.4081 |
738
+ | cosine_accuracy@3 | 0.6312 |
739
+ | cosine_accuracy@5 | 0.7177 |
740
+ | cosine_accuracy@10 | 0.8077 |
741
+ | cosine_precision@1 | 0.4081 |
742
+ | cosine_precision@3 | 0.2104 |
743
+ | cosine_precision@5 | 0.1435 |
744
+ | cosine_precision@10 | 0.0808 |
745
+ | cosine_recall@1 | 0.4081 |
746
+ | cosine_recall@3 | 0.6312 |
747
+ | cosine_recall@5 | 0.7177 |
748
+ | cosine_recall@10 | 0.8077 |
749
+ | cosine_ndcg@10 | 0.6045 |
750
+ | cosine_mrr@10 | 0.5399 |
751
+ | **cosine_map@100** | **0.5472** |
752
+
753
+ <!--
754
+ ## Bias, Risks and Limitations
755
+
756
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
757
+ -->
758
+
759
+ <!--
760
+ ### Recommendations
761
+
762
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
763
+ -->
764
+
765
+ ## Training Details
766
+
767
+ ### Training Dataset
768
+
769
+ #### Unnamed Dataset
770
+
771
+
772
+ * Size: 3,262 training samples
773
+ * Columns: <code>anchor</code> and <code>positive</code>
774
+ * Approximate statistics based on the first 1000 samples:
775
+ | | anchor | positive |
776
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
777
+ | type | string | string |
778
+ | details | <ul><li>min: 15 tokens</li><li>mean: 29.17 tokens</li><li>max: 53 tokens</li></ul> | <ul><li>min: 308 tokens</li><li>mean: 510.05 tokens</li><li>max: 512 tokens</li></ul> |
779
+ * Samples:
780
+ | anchor | positive |
781
+ |:------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
782
+ | <code>Welche Datenbestände decken die Region Rostock und Umgebung ab und enthalten Informationen zu Verkehrswegen und -sicherheit?</code> | <code><br>Datenbestand<br> - titel: Großraum- und Schwertransportrouten<br> - typ: Fachverfahren<br> - kurzbeschreibung: Empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung mit Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind.<br> - allgemeine_beschreibung: Der Datensatz umfasst die empfohlenen Großraum- und Schwertransportwege in der Hanse- und Universitätsstadt Rostock und Umgebung. Er enthält Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind. Die Ressourcen werden regelmäßig alle 365 Tage aktualisiert.<br> - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt. Zuständige Behörden sind das Ministerium für Inneres und Europa Mecklenburg-Vorpommern mit dem Ressort Kommunalaufsicht. Die Daten enthalten wichtige Informationen für die Verkehrsplanung und -sicherheit in Rostock und Umgebung.<br> - zweck: Der Datensatz wird erhoben, um Informationen über empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung bereitzustellen. Er dient der Planung und Durchführung von Großraum- und Schwertransporten sowie der Sicherstellung der Verkehrssicherheit und Infrastrukturintegrität.<br> - einfuehrungsjahr: 2018<br>Datenbestand hat Datenlieferanten<br> - name: Hanse- und Universitätsstadt Rostock<br>Datenbestand hat Schlagwort<br> - name: verkehrsinfrastruktur<br> - name: Erlaubnis<br> - name: Genehmigung<br> - name: straßennetz<br> - name: stadtverkehr<br> - name: infrastruktur<br> - name: brücke<br> - name: Großraum- und Schwertransport<br> - name: straßenverkehrstechnik<br> - name: tunnel<br> - name: verkehr<br> - name: bauwerk<br> - name: Straßenverkehrs-Ordnung<br> - name: öffentlicher-verkehr<br> - name: straße<br> - name: verkehrstechnik<br> - name: straßenverkehr<br> - name: öffentliche-straße<br> - name: Straßenverkehrszulassungsverordnung<br>Datenbestand hat Kategorie<br> - name: Verkehr<br> - name: Regierung und öffentlicher Sektor<br> - name: Regionen und Städte<br>Datenbestand hat politische Ebenen<br> - name: Ebene der Landkreise und Regierungsbezirke<br>Datenbestand hat politisches Gebiet<br> - name: Rostock<br> - name: Hanse- und Universitätsstadt<br>Datenbestand hat Sprache<br> - name: Deutsch<br>Datenbestand hat geografische Abdeckung<br> - name: Rostock und Umgebung<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium des Innern und für Heimat<br> - kurzbezeichnung: BMI<br> - ressorts: Hanse- und Universitätsstadt Rostock<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Hanse- und Universitätsstadt Rostock<br> - kurzbezeichnung: Rostock<br> - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung<br> - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern<br> - ressort: Kommunalaufsicht<br>Datenbestand hat Gesetze:<br>Gesetz<br> - absatz: 3<br> - bezeichnung: Straßenverkehrs-Ordnung (StVO)<br> - kurzbezeichnung: StVO<br> - paragraph: § 29<br>Datenbestand hat Verordnung<br>Verordnung<br> - referenz: https://www.buzer.de/StTbV.htm<br> - bezeichnung: Straßenverkehr-Transportbegleitungsverordnung (StTbV)<br> - kurzbezeichnung: StTbV<br>Verordnung<br> - referenz: https://www.buzer.de/StTbV.htm<br> - bezeichnung: Straßenverkehrs-Zulassungs-Ordnung (StVZO)<br> - kurzbezeichnung: StVZO<br></code> |
783
+ | <code>Welche Datenbestände bieten Einblicke in die Standorte und Strukturen des THW für Koordinationszwecke im Katastrophenschutz?</code> | <code><br>Datenbestand<br> - titel: Übersicht der THW-Liegenschaften<br> - typ: Fachverfahren<br> - kurzbeschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Adressen und Geoinformationen zu den Standorten des Technischen Hilfswerks (THW) in Deutschland.<br> - allgemeine_beschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Informationen über die verschiedenen Standorte des Technischen Hilfswerks (THW) in Deutschland. Dazu gehören 668 Ortsverbände, 66 Geschäftsstellen, acht Landesverbände, eine Bundesschule mit zwei Standorten und die THW-Leitung. Die Daten enthalten Adressen und Geoinformationen zu den THW-Liegenschaften.<br> - fachliche_beschreibung: Der Datensatz wird von der Bundesanstalt Technisches Hilfswerk erhoben und bereitgestellt. Das THW ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt und hat als Aufgaben den Katastrophenschutz, technisch-humanitäre Hilfeleistungen und die Organisation von Einsatzkräften. Die Daten werden vom Referat Z2 - Organisation des THW geliefert und sind über das GovData Portal verfügbar.<br> - zweck: Der Datensatz wird erhoben, um einen umfassenden Überblick über die Standorte und Strukturen des Technischen Hilfswerks in Deutschland zu bieten. Er dient der Transparenz und kann für Planungs- und Koordinationszwecke im Bereich des Katastrophenschutzes und der technisch-humanitären Hilfeleistungen genutzt werden.<br> - einfuehrungsjahr: 2015<br> - zeitliche_abdeckung_start: 2015-01-01T00:00:00<br>Datenbestand hat Datenlieferanten<br> - name: Referat Z2 - Organisation<br> - name: Bundesanstalt Technisches Hilfswerk<br>Datenbestand hat Schlagwort<br> - name: THW-Landesverband<br> - name: THW-Ortsverband<br> - name: Rettung<br> - name: Katastrophenschutz<br> - name: Bergung<br> - name: THW-Leitung<br> - name: THW-Dienststellen<br> - name: technisch-humanitäre Hilfeleistungen<br> - name: THW-Liegenschaft<br> - name: Geoinformationen<br> - name: THW<br> - name: THW-Geschäftsstelle<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium des Innern und für Heimat<br> - kurzbezeichnung: BMI<br> - ressorts: Bundesanstalt Technisches Hilfswerk, Referat Z2 - Organisation<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Bundesanstalt Technisches Hilfswerk<br> - kurzbezeichnung: THW<br> - themen: Katastrophenschutz, technisch-humanitäre Hilfeleistungen, Organisation von Einsatzkräften<br> - ministerium_des_geschaeftsbereichs: Bundesministerium des Innern, für Bau und Heimat<br> - ressort: Geschäftsbereich des Bundesministeriums des Innern, für Bau und Heimat<br>Datenbestand hat Gesetze:<br>Gesetz<br> - absatz: 1<br> - bezeichnung: Gesetz über das Technische Hilfswerk (THW-Gesetz)<br> - kurzbezeichnung: THWG<br> - paragraph: § 4<br>Datenbestand hat Verordnung<br>Verordnung<br> - referenz: https://beck-online.beck.de/Normen/29337/T?pagenr=21&sortField=1&sortDirection=1<br> - bezeichnung: Technisches Hilfswerk-Auslandsunfallfürsorgeverordnung<br> - kurzbezeichnung: THW-AuslUFV<br>Verordnung<br> - referenz: https://ov-ludwigsburg.thw.de/fileadmin/user_upload/LVBW/GSTU/OLUD/Mediathek/Dokumente/thw_go_ea_anlage_00.pdf<br> - bezeichnung: Geschäftsordnung des Technischen Hilfswerks<br> - kurzbezeichnung: THW-GO<br></code> |
784
+ | <code>Welche Datensätze analysieren die Geschlechterverteilung von Schulabgängern ohne Abschluss in deutschen Kreisen von 2006 bis 2021?</code> | <code><br>Datenbestand<br> - titel: Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen<br> - typ: Fachverfahren<br> - kurzbeschreibung: Prozentualer Anteil von Frauen und Männern an Schulabgängern ohne Hauptschulabschluss nach Kreisen<br> - allgemeine_beschreibung: Der Datensatz enthält den prozentualen Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen in Deutschland.<br> - fachliche_beschreibung: Der Datensatz wird vom Bundesministerium für Familie, Senioren, Frauen und Jugend bereitgestellt und enthält Informationen über den Anteil von Frauen und Männern an Schulabgängern ohne ersten Schulabschluss aus allgemeinbildenden Schulen in Deutschland. Die Daten werden nach Kreisen aufgeschlüsselt und dienen der Analyse der Bildungssituation in verschiedenen Regionen des Landes.<br> - zweck: Der Datensatz wird erhoben, um die Geschlechterverteilung bei Schulabgängern ohne Hauptschulabschluss in verschiedenen Regionen Deutschlands zu analysieren und mögliche Maßnahmen zur Verbesserung der Bildungschancen zu entwickeln.<br> - einfuehrungsjahr: 2023<br> - zeitliche_abdeckung_start: 2006-01-01<br> - zeitliche_abdeckung_ende: 2021-12-31<br>Datenbestand hat Datenlieferanten<br> - name: Bundesministerium für Familie<br> - name: Frauen und Jugend<br> - name: Senioren<br>Datenbestand hat Schlagwort<br> - name: bildung<br> - name: schulabbrecher<br> - name: gleichstellung<br> - name: schulabschluss<br> - name: schule<br>Datenbestand hat Kategorie<br> - name: Bevölkerung und Gesellschaft<br>Datenbestand hat politische Ebenen<br> - name: Ebene der Landkreise und Regierungsbezirke<br>Datenbestand hat Sprache<br> - name: Deutsch<br>Datenbestand hat geografische Abdeckung<br> - name: Bundesrepublik Deutschland<br> - name: aufgeschlüsselt nach Kreisen<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - kurzbezeichnung: BMFSFJ<br> - ressorts: Familie, Senioren, Frauen, Jugend<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - kurzbezeichnung: BMFSFJ<br> - ministerium_des_geschaeftsbereichs: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - ressort: Bundesministerium für Familie, Senioren, Frauen und Jugend<br>Datenbestand hat Gesetze:<br>Gesetz<br> - bezeichnung: E-Government-Gesetz<br>Datenbestand hat Verordnung<br>Verordnung<br>Verordnung<br> - referenz: https://recht.nrw.de/lmi/owa/br_vbl_detail_text?anw_nr=6&vd_id=20346&vd_back=N405&sg=0&menu=0<br> - bezeichnung: § 50 Schulgesetz NRW<br></code> |
785
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
786
+ ```json
787
+ {
788
+ "loss": "MultipleNegativesRankingLoss",
789
+ "matryoshka_dims": [
790
+ 512
791
+ ],
792
+ "matryoshka_weights": [
793
+ 1
794
+ ],
795
+ "n_dims_per_step": -1
796
+ }
797
+ ```
798
+
799
+ ### Training Hyperparameters
800
+ #### Non-Default Hyperparameters
801
+
802
+ - `eval_strategy`: epoch
803
+ - `learning_rate`: 1e-05
804
+ - `warmup_ratio`: 0.1
805
+ - `bf16`: True
806
+ - `tf32`: False
807
+ - `load_best_model_at_end`: True
808
+
809
+ #### All Hyperparameters
810
+ <details><summary>Click to expand</summary>
811
+
812
+ - `overwrite_output_dir`: False
813
+ - `do_predict`: False
814
+ - `eval_strategy`: epoch
815
+ - `prediction_loss_only`: True
816
+ - `per_device_train_batch_size`: 8
817
+ - `per_device_eval_batch_size`: 8
818
+ - `per_gpu_train_batch_size`: None
819
+ - `per_gpu_eval_batch_size`: None
820
+ - `gradient_accumulation_steps`: 1
821
+ - `eval_accumulation_steps`: None
822
+ - `torch_empty_cache_steps`: None
823
+ - `learning_rate`: 1e-05
824
+ - `weight_decay`: 0.0
825
+ - `adam_beta1`: 0.9
826
+ - `adam_beta2`: 0.999
827
+ - `adam_epsilon`: 1e-08
828
+ - `max_grad_norm`: 1.0
829
+ - `num_train_epochs`: 3
830
+ - `max_steps`: -1
831
+ - `lr_scheduler_type`: linear
832
+ - `lr_scheduler_kwargs`: {}
833
+ - `warmup_ratio`: 0.1
834
+ - `warmup_steps`: 0
835
+ - `log_level`: passive
836
+ - `log_level_replica`: warning
837
+ - `log_on_each_node`: True
838
+ - `logging_nan_inf_filter`: True
839
+ - `save_safetensors`: True
840
+ - `save_on_each_node`: False
841
+ - `save_only_model`: False
842
+ - `restore_callback_states_from_checkpoint`: False
843
+ - `no_cuda`: False
844
+ - `use_cpu`: False
845
+ - `use_mps_device`: False
846
+ - `seed`: 42
847
+ - `data_seed`: None
848
+ - `jit_mode_eval`: False
849
+ - `use_ipex`: False
850
+ - `bf16`: True
851
+ - `fp16`: False
852
+ - `fp16_opt_level`: O1
853
+ - `half_precision_backend`: auto
854
+ - `bf16_full_eval`: False
855
+ - `fp16_full_eval`: False
856
+ - `tf32`: False
857
+ - `local_rank`: 0
858
+ - `ddp_backend`: None
859
+ - `tpu_num_cores`: None
860
+ - `tpu_metrics_debug`: False
861
+ - `debug`: []
862
+ - `dataloader_drop_last`: False
863
+ - `dataloader_num_workers`: 0
864
+ - `dataloader_prefetch_factor`: None
865
+ - `past_index`: -1
866
+ - `disable_tqdm`: False
867
+ - `remove_unused_columns`: True
868
+ - `label_names`: None
869
+ - `load_best_model_at_end`: True
870
+ - `ignore_data_skip`: False
871
+ - `fsdp`: []
872
+ - `fsdp_min_num_params`: 0
873
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
874
+ - `fsdp_transformer_layer_cls_to_wrap`: None
875
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
876
+ - `deepspeed`: None
877
+ - `label_smoothing_factor`: 0.0
878
+ - `optim`: adamw_torch
879
+ - `optim_args`: None
880
+ - `adafactor`: False
881
+ - `group_by_length`: False
882
+ - `length_column_name`: length
883
+ - `ddp_find_unused_parameters`: None
884
+ - `ddp_bucket_cap_mb`: None
885
+ - `ddp_broadcast_buffers`: False
886
+ - `dataloader_pin_memory`: True
887
+ - `dataloader_persistent_workers`: False
888
+ - `skip_memory_metrics`: True
889
+ - `use_legacy_prediction_loop`: False
890
+ - `push_to_hub`: False
891
+ - `resume_from_checkpoint`: None
892
+ - `hub_model_id`: None
893
+ - `hub_strategy`: every_save
894
+ - `hub_private_repo`: False
895
+ - `hub_always_push`: False
896
+ - `gradient_checkpointing`: False
897
+ - `gradient_checkpointing_kwargs`: None
898
+ - `include_inputs_for_metrics`: False
899
+ - `eval_do_concat_batches`: True
900
+ - `fp16_backend`: auto
901
+ - `push_to_hub_model_id`: None
902
+ - `push_to_hub_organization`: None
903
+ - `mp_parameters`:
904
+ - `auto_find_batch_size`: False
905
+ - `full_determinism`: False
906
+ - `torchdynamo`: None
907
+ - `ray_scope`: last
908
+ - `ddp_timeout`: 1800
909
+ - `torch_compile`: False
910
+ - `torch_compile_backend`: None
911
+ - `torch_compile_mode`: None
912
+ - `dispatch_batches`: None
913
+ - `split_batches`: None
914
+ - `include_tokens_per_second`: False
915
+ - `include_num_input_tokens_seen`: False
916
+ - `neftune_noise_alpha`: None
917
+ - `optim_target_modules`: None
918
+ - `batch_eval_metrics`: False
919
+ - `eval_on_start`: False
920
+ - `use_liger_kernel`: False
921
+ - `eval_use_gather_object`: False
922
+ - `batch_sampler`: batch_sampler
923
+ - `multi_dataset_batch_sampler`: proportional
924
+
925
+ </details>
926
+
927
+ ### Training Logs
928
+ | Epoch | Step | Training Loss | dim_512_cosine_map@100 |
929
+ |:-------:|:-------:|:-------------:|:----------------------:|
930
+ | 0 | 0 | - | 0.5212 |
931
+ | 0.0490 | 10 | 1.2397 | - |
932
+ | 0.0980 | 20 | 0.7542 | - |
933
+ | 0.1471 | 30 | 0.3055 | - |
934
+ | 0.1961 | 40 | 0.2075 | - |
935
+ | 0.2451 | 50 | 0.2064 | - |
936
+ | 0.2941 | 60 | 0.1429 | - |
937
+ | 0.3431 | 70 | 0.1821 | - |
938
+ | 0.3922 | 80 | 0.063 | - |
939
+ | 0.4412 | 90 | 0.078 | - |
940
+ | 0.4902 | 100 | 0.1026 | - |
941
+ | 0.5392 | 110 | 0.0717 | - |
942
+ | 0.5882 | 120 | 0.0394 | - |
943
+ | 0.6373 | 130 | 0.0751 | - |
944
+ | 0.6863 | 140 | 0.1377 | - |
945
+ | 0.7353 | 150 | 0.0666 | - |
946
+ | 0.7843 | 160 | 0.127 | - |
947
+ | 0.8333 | 170 | 0.1129 | - |
948
+ | 0.8824 | 180 | 0.0734 | - |
949
+ | 0.9314 | 190 | 0.0727 | - |
950
+ | 0.9804 | 200 | 0.1564 | - |
951
+ | 1.0 | 204 | - | 0.5428 |
952
+ | 1.0294 | 210 | 0.0904 | - |
953
+ | 1.0784 | 220 | 0.0974 | - |
954
+ | 1.1275 | 230 | 0.0785 | - |
955
+ | 1.1765 | 240 | 0.0704 | - |
956
+ | 1.2255 | 250 | 0.0929 | - |
957
+ | 1.2745 | 260 | 0.1119 | - |
958
+ | 1.3235 | 270 | 0.0459 | - |
959
+ | 1.3725 | 280 | 0.1181 | - |
960
+ | 1.4216 | 290 | 0.0459 | - |
961
+ | 1.4706 | 300 | 0.0248 | - |
962
+ | 1.5196 | 310 | 0.0567 | - |
963
+ | 1.5686 | 320 | 0.0247 | - |
964
+ | 1.6176 | 330 | 0.0412 | - |
965
+ | 1.6667 | 340 | 0.0498 | - |
966
+ | 1.7157 | 350 | 0.0693 | - |
967
+ | 1.7647 | 360 | 0.0589 | - |
968
+ | 1.8137 | 370 | 0.0383 | - |
969
+ | 1.8627 | 380 | 0.0429 | - |
970
+ | 1.9118 | 390 | 0.0466 | - |
971
+ | 1.9608 | 400 | 0.0331 | - |
972
+ | **2.0** | **408** | **-** | **0.5469** |
973
+ | 2.0098 | 410 | 0.0812 | - |
974
+ | 2.0588 | 420 | 0.0705 | - |
975
+ | 2.1078 | 430 | 0.0215 | - |
976
+ | 2.1569 | 440 | 0.0571 | - |
977
+ | 2.2059 | 450 | 0.0821 | - |
978
+ | 2.2549 | 460 | 0.046 | - |
979
+ | 2.3039 | 470 | 0.0165 | - |
980
+ | 2.3529 | 480 | 0.0335 | - |
981
+ | 2.4020 | 490 | 0.0339 | - |
982
+ | 2.4510 | 500 | 0.0291 | - |
983
+ | 2.5 | 510 | 0.0788 | - |
984
+ | 2.5490 | 520 | 0.0468 | - |
985
+ | 2.5980 | 530 | 0.0457 | - |
986
+ | 2.6471 | 540 | 0.0121 | - |
987
+ | 2.6961 | 550 | 0.0543 | - |
988
+ | 2.7451 | 560 | 0.0463 | - |
989
+ | 2.7941 | 570 | 0.0974 | - |
990
+ | 2.8431 | 580 | 0.0204 | - |
991
+ | 2.8922 | 590 | 0.012 | - |
992
+ | 2.9412 | 600 | 0.0545 | - |
993
+ | 2.9902 | 610 | 0.0581 | - |
994
+ | 3.0 | 612 | - | 0.5472 |
995
+
996
+ * The bold row denotes the saved checkpoint.
997
+
998
+ ### Framework Versions
999
+ - Python: 3.10.12
1000
+ - Sentence Transformers: 3.1.1
1001
+ - Transformers: 4.45.2
1002
+ - PyTorch: 2.4.1+cu121
1003
+ - Accelerate: 1.0.0
1004
+ - Datasets: 3.0.1
1005
+ - Tokenizers: 0.20.1
1006
+
1007
+ ## Citation
1008
+
1009
+ ### BibTeX
1010
+
1011
+ #### Sentence Transformers
1012
+ ```bibtex
1013
+ @inproceedings{reimers-2019-sentence-bert,
1014
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1015
+ author = "Reimers, Nils and Gurevych, Iryna",
1016
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1017
+ month = "11",
1018
+ year = "2019",
1019
+ publisher = "Association for Computational Linguistics",
1020
+ url = "https://arxiv.org/abs/1908.10084",
1021
+ }
1022
+ ```
1023
+
1024
+ #### MatryoshkaLoss
1025
+ ```bibtex
1026
+ @misc{kusupati2024matryoshka,
1027
+ title={Matryoshka Representation Learning},
1028
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
1029
+ year={2024},
1030
+ eprint={2205.13147},
1031
+ archivePrefix={arXiv},
1032
+ primaryClass={cs.LG}
1033
+ }
1034
+ ```
1035
+
1036
+ #### MultipleNegativesRankingLoss
1037
+ ```bibtex
1038
+ @misc{henderson2017efficient,
1039
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1040
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1041
+ year={2017},
1042
+ eprint={1705.00652},
1043
+ archivePrefix={arXiv},
1044
+ primaryClass={cs.CL}
1045
+ }
1046
+ ```
1047
+
1048
+ <!--
1049
+ ## Glossary
1050
+
1051
+ *Clearly define terms in order to be accessible across audiences.*
1052
+ -->
1053
+
1054
+ <!--
1055
+ ## Model Card Authors
1056
+
1057
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1058
+ -->
1059
+
1060
+ <!--
1061
+ ## Model Card Contact
1062
+
1063
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1064
+ -->
added_tokens.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "[MXBAI_P]": 178884,
3
+ "[MXBAI_Q]": 178883
4
+ }
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "mixedbread-ai/deepset-mxbai-embed-de-large-v1",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.45.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": false,
27
+ "vocab_size": 178885
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.1.1",
4
+ "transformers": "4.45.2",
5
+ "pytorch": "2.4.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9aa4e132e9aa5636a2f1321907026ba10176086395ef20c800273d6cf92920cc
3
+ size 1948311760
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "[MXBAI_Q]",
4
+ "[MXBAI_P]"
5
+ ],
6
+ "bos_token": {
7
+ "content": "<s>",
8
+ "lstrip": false,
9
+ "normalized": false,
10
+ "rstrip": false,
11
+ "single_word": false
12
+ },
13
+ "cls_token": {
14
+ "content": "<s>",
15
+ "lstrip": false,
16
+ "normalized": false,
17
+ "rstrip": false,
18
+ "single_word": false
19
+ },
20
+ "eos_token": {
21
+ "content": "</s>",
22
+ "lstrip": false,
23
+ "normalized": false,
24
+ "rstrip": false,
25
+ "single_word": false
26
+ },
27
+ "mask_token": {
28
+ "content": "<mask>",
29
+ "lstrip": true,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false
33
+ },
34
+ "pad_token": {
35
+ "content": "<pad>",
36
+ "lstrip": false,
37
+ "normalized": false,
38
+ "rstrip": false,
39
+ "single_word": false
40
+ },
41
+ "sep_token": {
42
+ "content": "</s>",
43
+ "lstrip": false,
44
+ "normalized": false,
45
+ "rstrip": false,
46
+ "single_word": false
47
+ },
48
+ "unk_token": {
49
+ "content": "<unk>",
50
+ "lstrip": false,
51
+ "normalized": false,
52
+ "rstrip": false,
53
+ "single_word": false
54
+ }
55
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b319c37e4f1e5f8f1c8dba7e1bc7b1a424184365d7f982ada0f18ab60c514c07
3
+ size 12283980
tokenizer_config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "178882": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ },
43
+ "178883": {
44
+ "content": "[MXBAI_Q]",
45
+ "lstrip": false,
46
+ "normalized": false,
47
+ "rstrip": false,
48
+ "single_word": false,
49
+ "special": true
50
+ },
51
+ "178884": {
52
+ "content": "[MXBAI_P]",
53
+ "lstrip": false,
54
+ "normalized": false,
55
+ "rstrip": false,
56
+ "single_word": false,
57
+ "special": true
58
+ }
59
+ },
60
+ "additional_special_tokens": [
61
+ "[MXBAI_Q]",
62
+ "[MXBAI_P]"
63
+ ],
64
+ "bos_token": "<s>",
65
+ "clean_up_tokenization_spaces": true,
66
+ "cls_token": "<s>",
67
+ "eos_token": "</s>",
68
+ "mask_token": "<mask>",
69
+ "model_max_length": 512,
70
+ "pad_token": "<pad>",
71
+ "sep_token": "</s>",
72
+ "tokenizer_class": "XLMRobertaTokenizer",
73
+ "unk_token": "<unk>"
74
+ }
training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ba9d6452883002399e6e0c6117f9bd3fb5fe792180fc8266e9746fdef221a75f
3
+ size 5624