FareedKhan
commited on
Commit
•
1ea5d10
1
Parent(s):
1fd1803
Upload folder using huggingface_hub
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +1064 -0
- added_tokens.json +4 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- sentencepiece.bpe.model +3 -0
- special_tokens_map.json +55 -0
- tokenizer.json +3 -0
- tokenizer_config.json +74 -0
- training_args.bin +3 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,1064 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
base_model: mixedbread-ai/deepset-mxbai-embed-de-large-v1
|
3 |
+
library_name: sentence-transformers
|
4 |
+
metrics:
|
5 |
+
- cosine_accuracy@1
|
6 |
+
- cosine_accuracy@3
|
7 |
+
- cosine_accuracy@5
|
8 |
+
- cosine_accuracy@10
|
9 |
+
- cosine_precision@1
|
10 |
+
- cosine_precision@3
|
11 |
+
- cosine_precision@5
|
12 |
+
- cosine_precision@10
|
13 |
+
- cosine_recall@1
|
14 |
+
- cosine_recall@3
|
15 |
+
- cosine_recall@5
|
16 |
+
- cosine_recall@10
|
17 |
+
- cosine_ndcg@10
|
18 |
+
- cosine_mrr@10
|
19 |
+
- cosine_map@100
|
20 |
+
pipeline_tag: sentence-similarity
|
21 |
+
tags:
|
22 |
+
- sentence-transformers
|
23 |
+
- sentence-similarity
|
24 |
+
- feature-extraction
|
25 |
+
- generated_from_trainer
|
26 |
+
- dataset_size:3262
|
27 |
+
- loss:MatryoshkaLoss
|
28 |
+
- loss:MultipleNegativesRankingLoss
|
29 |
+
widget:
|
30 |
+
- source_sentence: In welchen Datenbeständen wird das Gesetz UrhG in Bezug auf historische
|
31 |
+
topographische Informationen aus dem 18. Jahrhundert referenziert?
|
32 |
+
sentences:
|
33 |
+
- "\nDatenbestand\n - titel: Parkscheinautomaten (PSA) Standorte öffentlich anzeigen\n\
|
34 |
+
\ - typ: Fachverfahren\n - kurzbeschreibung: Maschinenlesbare Dateien mit\
|
35 |
+
\ aktuellen Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow.\n -\
|
36 |
+
\ allgemeine_beschreibung: Es werden 2 maschinenlesbare Dateien mit den aktuellen\
|
37 |
+
\ Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow bereitgestellt.\n\
|
38 |
+
\ - fachliche_beschreibung: Der Datensatz wird vom Bezirksamt Pankow, Amt für\
|
39 |
+
\ öffentliche Ordnung bereitgestellt. Er dient der Transparenz und der besseren\
|
40 |
+
\ Orientierung im Straßenverkehr in Pankow. Die relevanten Behörden sind das Bezirksamt\
|
41 |
+
\ Pankow und die FITKO (Föderale IT-Kooperation), welche das GovData Portal betreibt.\n\
|
42 |
+
\ - zweck: Der Datensatz wird erhoben, um den Bürgerinnen und Bürgern sowie\
|
43 |
+
\ Besucherinnen und Besuchern von Pankow die Standorte der Parkscheinautomaten\
|
44 |
+
\ (PSA) zugänglich zu machen und somit das Auffinden von Parkmöglichkeiten zu\
|
45 |
+
\ erleichtern.\n - einfuehrungsjahr: 2021\nDatenbestand hat Datenlieferanten\n\
|
46 |
+
\ - name: Amt für öffentliche Ordnung\n - name: Bezirksamt Pankow\nDatenbestand\
|
47 |
+
\ hat Schlagwort\n - name: ticket\n - name: parkscheinautomat\n - name:\
|
48 |
+
\ parkplatz\n - name: parken\n - name: parkraumbewirtschaftung\n - name:\
|
49 |
+
\ pankow\n - name: parkticket\n - name: handyparken\n - name: ordnungsamt\n\
|
50 |
+
\ - name: berlin\nDatenbestand hat Kategorie\n - name: Verkehr\nDatenbestand\
|
51 |
+
\ hat politische Ebenen\n - name: Ebene der Landkreise und Regierungsbezirke\n\
|
52 |
+
Datenbestand hat politisches Gebiet\n - name: 110010001003\nDatenbestand hat\
|
53 |
+
\ Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n \
|
54 |
+
\ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
|
55 |
+
\ BMI\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Ordnungsamt\n \
|
56 |
+
\ - kurzbezeichnung: OA\n - themen: Öffentliche Ordnung, Ordnungswidrigkeiten,\
|
57 |
+
\ Lebensmittelaufsicht\n - ministerium_des_geschaeftsbereichs: Innere Verwaltung\n\
|
58 |
+
\ - ressort: Ordnungs- und Sicherheitsangelegenheiten\nDatenbestand hat Gesetze:\n\
|
59 |
+
Gesetz\n - bezeichnung: Gesetz zur Durchführung der Verordnung (EU) 2016/425\
|
60 |
+
\ des Europäischen Parlaments und des Rates vom 9. März 2016 über persönliche\
|
61 |
+
\ Schutzausrüstungen (PSA)\n - kurzbezeichnung: PSA-DG\nDatenbestand hat Verordnung\n\
|
62 |
+
Verordnung\nVerordnung\n - referenz: https://www.transparenz.bremen.de/sixcms/detail.php?gsid=bremen2014_tp.c.69002.de&asl=bremen203_tpgesetz.c.55340.de&template=20_gp_ifg_meta_detail_d\n\
|
63 |
+
\ - bezeichnung: Verordnung über Parkgebühren\n"
|
64 |
+
- "\nDatenbestand\n - titel: Naphthalin im Meerwasser 2003\n - typ: Fachverfahren\n\
|
65 |
+
\ - kurzbeschreibung: Messung des Parameters 'Naphthalin im Meerwasser' im\
|
66 |
+
\ Jahr 2003 im Rahmen von Überwachungsprogrammen für Nord- und Ostsee.\n -\
|
67 |
+
\ allgemeine_beschreibung: Der Datensatz 'Naphthalin im Meerwasser 2003' wurde\
|
68 |
+
\ im Rahmen des gemeinsamen Bund/Länder-Messprogramms für die Nord- und Ostsee\
|
69 |
+
\ sowie weiterer Überwachungsprogramme erhoben, um den Parameter 'Naphthalin im\
|
70 |
+
\ Meerwasser' zu bestimmen.\n - fachliche_beschreibung: Der Datensatz wird\
|
71 |
+
\ vom Bundesamt für Seeschifffahrt und Hydrographie (BSH) erhoben. Er dient der\
|
72 |
+
\ Überwachung der Meeresumwelt in Nord- und Ostsee hinsichtlich des Parameters\
|
73 |
+
\ 'Naphthalin im Meerwasser'.\n - zweck: Der Datensatz wird erhoben, um die\
|
74 |
+
\ Konzentration von Naphthalin im Meerwasser zu überwachen und mögliche Umweltauswirkungen\
|
75 |
+
\ zu bewerten.\n - einfuehrungsjahr: 2024\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
|
76 |
+
\ - zeitliche_abdeckung_start: 2003-05-20\n - zeitliche_abdeckung_ende:\
|
77 |
+
\ 2003-08-10\nDatenbestand hat Datenlieferanten\n - name: Bundesamt für Seeschifffahrt\
|
78 |
+
\ und Hydrographie (BSH)\nDatenbestand hat Schlagwort\n - name: open-data\n\
|
79 |
+
\ - name: monitoring\n - name: naphthalene\n - name: nordsee\n - name:\
|
80 |
+
\ bundesamt-für-seeschifffahrt-und-hydrographie\n - name: wasser\n - name:\
|
81 |
+
\ baltic-sea\n - name: the-federal-maritime-and-hydrographic-agency\n -\
|
82 |
+
\ name: naphthalin\n - name: bsh\n - name: opendata\n - name: nap\n \
|
83 |
+
\ - name: ostsee\n - name: north-sea\n - name: national\n - name: 2003\n\
|
84 |
+
\ - name: water\nDatenbestand hat Kategorie\n - name: Wissenschaft und Technologie\n\
|
85 |
+
\ - name: Fischerei\n - name: Verkehr\n - name: Umwelt\n - name: Regionen\
|
86 |
+
\ und Städte\n - name: Landwirtschaft\n - name: Forstwirtschaft und Nahrungsmittel\n\
|
87 |
+
Datenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\n\
|
88 |
+
Ministerium\n - bezeichnung: Bundesministerium für Wirtschaft und Klimaschutz\n\
|
89 |
+
\ - kurzbezeichnung: BMWK\n - ressorts: Bundesamt für Seeschifffahrt und\
|
90 |
+
\ Hydrographie (BSH)\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesamt\
|
91 |
+
\ für Seeschifffahrt und Hydrographie (BSH)\n - kurzbezeichnung: BSH\n -\
|
92 |
+
\ themen: Seeschifffahrt, Hydrographie, Schifffahrtssicherheit, Meeresumweltschutz\n\
|
93 |
+
\ - ministerium_des_geschaeftsbereichs: Bundesministerium für Verkehr und digitale\
|
94 |
+
\ Infrastruktur\n - ressort: Verkehr\nDatenbestand hat Gesetze:\nGesetz\n \
|
95 |
+
\ - bezeichnung: Grenzwerteverordnung 2003\n - kurzbezeichnung: GKV 2003\n\
|
96 |
+
Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf\n\
|
97 |
+
\ - bezeichnung: Leitfaden zur Anwendung umweltverträglicher Stoffe\nVerordnung\n\
|
98 |
+
\ - referenz: https://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:268:0029:0043:de:PDF\n\
|
99 |
+
\ - bezeichnung: VERORDNUNG (EG) Nr. 1831/2003 DES EUROPÄISCHEN PARLAMENTS\
|
100 |
+
\ UND DES RATES vom 22. September 2003\nVerordnung\n - referenz: https://rathaus.rostock.de/media/rostock_01.a.4984.de/datei/warnowbruecke_u19_umweltfachliche_untersuchungen_wrrl.pdf\n\
|
101 |
+
\ - bezeichnung: Verordnung zum Schutz der Oberflächengewässer\n - kurzbezeichnung:\
|
102 |
+
\ OGewV\nVerordnung\n - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf\n\
|
103 |
+
\ - bezeichnung: Verordnung über Anforderungen an das Einleiten von Abwasser\
|
104 |
+
\ in Gewässer\n"
|
105 |
+
- "\nDatenbestand\n - titel: Schmettausches Kartenwerk Brandenburg-Sektion 77,\
|
106 |
+
\ Potsdam\n - typ: Fachverfahren\n - kurzbeschreibung: Historisches topographisches\
|
107 |
+
\ Kartenwerk im Maßstab 1:50.000 für das preußische Staatsgebiet östlich der Weser,\
|
108 |
+
\ erstellt zwischen 1767 und 1787.\n - allgemeine_beschreibung: Das Schmettausche\
|
109 |
+
\ Kartenwerk Brandenburg-Sektion 77, Potsdam, ist ein historisches topographisches\
|
110 |
+
\ Kartenwerk im Maßstab 1:50.000, das zwischen 1767 und 1787 erstellt wurde. Es\
|
111 |
+
\ umfasst insgesamt 270 handgezeichnete Blätter und stellt das damalige preußische\
|
112 |
+
\ Staatsgebiet östlich der Weser detailliert dar. Die Originale des Kartenwerks\
|
113 |
+
\ befinden sich in der Staatsbibliothek zu Berlin - Preußischer Kulturbesitz.\n\
|
114 |
+
\ - fachliche_beschreibung: Das Schmettausche Kartenwerk Brandenburg-Sektion\
|
115 |
+
\ 77, Potsdam, wird von der Landesvermessung und Geobasisinformation Brandenburg\
|
116 |
+
\ (LGB) bereitgestellt. Es gehört zum Ressort der Vermessung, Geobasisinformation\
|
117 |
+
\ und Katasterverwaltung. Die historischen Karten bieten Einblicke in die topographische\
|
118 |
+
\ Darstellung des preußischen Staatsgebiets im 18. Jahrhundert und dienen Forschungszwecken\
|
119 |
+
\ im Bereich der Geographie, Geschichte und Kartographie.\n - zweck: Der Zweck\
|
120 |
+
\ des Datensatzes besteht darin, historische topographische Informationen über\
|
121 |
+
\ das preußische Staatsgebiet östlich der Weser im 18. Jahrhundert bereitzustellen.\
|
122 |
+
\ Das Kartenwerk dient der Erforschung und Analyse historischer Gegebenheiten,\
|
123 |
+
\ insbesondere im Bereich der Vermessung und Kartographie.\n - einfuehrungsjahr:\
|
124 |
+
\ 2024\n - aktualisierungsfrequenz: unbekannt\nDatenbestand hat Datenlieferanten\n\
|
125 |
+
\ - name: Landesvermessung und Geobasisinformation Brandenburg (LGB)\nDatenbestand\
|
126 |
+
\ hat Schlagwort\n - name: preußisches Staatsgebiet\n - name: 150.000\n\
|
127 |
+
\ - name: historisch\n - name: vermessung\n - name: Vermessung\n -\
|
128 |
+
\ name: Kartographie\n - name: opendata\n - name: bodenbedeckung\n -\
|
129 |
+
\ name: karte\n - name: topographie\n - name: 18. Jahrhundert\nDatenbestand\
|
130 |
+
\ hat Kategorie\n - name: Wissenschaft und Technologie\n - name: Fischerei\n\
|
131 |
+
\ - name: Umwelt\n - name: Regierung und öffentlicher Sektor\n - name:\
|
132 |
+
\ Regionen und Städte\n - name: Landwirtschaft\n - name: Forstwirtschaft\
|
133 |
+
\ und Nahrungsmittel\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
|
134 |
+
\ Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n \
|
135 |
+
\ - ressorts: Landesvermessung und Geobasisinformation Brandenburg (LGB)\nDatenbestand\
|
136 |
+
\ hat Behörde\nBehoerde\n - bezeichnung: Landesvermessung und Geobasisinformation\
|
137 |
+
\ Brandenburg (LGB)\n - kurzbezeichnung: LGB\n - themen: Vermessung, Geobasisinformation,\
|
138 |
+
\ Katasterverwaltung\n - ministerium_des_geschaeftsbereichs: Ministerium für\
|
139 |
+
\ Infrastruktur und Landesplanung des Landes Brandenburg\n - ressort: Landesvermessung,\
|
140 |
+
\ Geoinformation\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Gesetz\
|
141 |
+
\ über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz)\n - kurzbezeichnung:\
|
142 |
+
\ UrhG\n - paragraph: § 70\nDatenbestand hat Verordnung\nVerordnung\nVerordnung\n\
|
143 |
+
\ - referenz: https://geobasis-bb.de/lgb/de/service/nutzungsbedingungen/\n\
|
144 |
+
\ - bezeichnung: Nutzungsbedingungen des Landesvermessung und Geobasisinformation\
|
145 |
+
\ Brandenburg (LGB)\n"
|
146 |
+
- source_sentence: In welchen Datenbeständen finde ich vom BMI überwachte Informationen
|
147 |
+
zu Kinderbetreuungsstätten in Nobitz?
|
148 |
+
sentences:
|
149 |
+
- "\nDatenbestand\n - titel: Kindertagesstätten der Gemeinde Nobitz und der beauftragenden\
|
150 |
+
\ Gemeinden\n - typ: Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten\
|
151 |
+
\ und Kinderkrippen der Gemeinde Nobitz und beauftragenden Gemeinden.\n - allgemeine_beschreibung:\
|
152 |
+
\ Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Gemeinde\
|
153 |
+
\ Nobitz und der beauftragenden Gemeinden. Es handelt sich um einen Sekundärdatenbestand.\
|
154 |
+
\ Die Kindertagesstätten werden von der Gemeinde Nobitz und den beauftragenden\
|
155 |
+
\ Gemeinden betrieben.\n - fachliche_beschreibung: Der Datensatz zu den Kindertagesstätten\
|
156 |
+
\ wird von der Gemeinde Nobitz und den beauftragenden Gemeinden verwaltet. Zuständige\
|
157 |
+
\ Behörden sind die Gemeinde Nobitz und die beauftragenden Gemeinden, die im Bereich\
|
158 |
+
\ der Kinderbetreuung tätig sind. Die Daten werden regelmäßig aktualisiert und\
|
159 |
+
\ über das FITKO (Föderale IT-Kooperation) – GovData Portal bereitgestellt.\n\
|
160 |
+
\ - zweck: Der Datensatz wird erhoben, um den Bürgern und Bürgerinnen sowie\
|
161 |
+
\ interessierten Personen Informationen über die Standorte von Kindertagesstätten\
|
162 |
+
\ in Nobitz und den beauftragenden Gemeinden zur Verfügung zu stellen. Dies dient\
|
163 |
+
\ der Transparenz und der besseren Zugänglichkeit von Informationen im Bereich\
|
164 |
+
\ der Kinderbetreuung.\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
|
165 |
+
Datenbestand hat Datenlieferanten\n - name: Gemeinde Nobitz und der beauftragenden\
|
166 |
+
\ Gemeinden\nDatenbestand hat Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n\
|
167 |
+
\ - name: kindertagesstätten\n - name: langenleuba-niederhain\n - name:\
|
168 |
+
\ kindergarten\n - name: kinderbetreuung\n - name: thüringen\n - name:\
|
169 |
+
\ opendata\n - name: göpfersdorf\n - name: kinderkrippe\n - name: kita\n\
|
170 |
+
Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
|
171 |
+
\ - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n\
|
172 |
+
\ - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n - name:\
|
173 |
+
\ Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium\
|
174 |
+
\ des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Gemeinde\
|
175 |
+
\ Nobitz, beauftragenden Gemeinden\nDatenbestand hat Behörde\nBehoerde\n -\
|
176 |
+
\ bezeichnung: Gemeinde Nobitz\n - kurzbezeichnung: Nobitz\n - themen: Gemeindeverwaltung,\
|
177 |
+
\ Verwaltungsaufgaben, Kommunalpolitik\n - ministerium_des_geschaeftsbereichs:\
|
178 |
+
\ Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalaufsicht\n\
|
179 |
+
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n\
|
180 |
+
\ - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n \
|
181 |
+
\ - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob\n\
|
182 |
+
\ - bezeichnung: Satzung über die Benutzung der Kindertageseinrichtungen in\
|
183 |
+
\ kommunaler Trägerschaft der Gemeinde Nobitz (KitaBenS)\n - kurzbezeichnung:\
|
184 |
+
\ KitaBenS\nVerordnung\n - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob/@@getlink?id=1339072591\n\
|
185 |
+
\ - bezeichnung: Kindertageseinrichtungen in kommunaler Trägerschaft der Gemeinde\
|
186 |
+
\ Nobitz\n - kurzbezeichnung: KitaGebS\nVerordnung\n - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob\n\
|
187 |
+
\ - bezeichnung: Ordnungsbehördliche Verordnung\n"
|
188 |
+
- "\nDatenbestand\n - titel: Preußische Urmesstischblätter 1 : 25 000 4345 Herzberg/Elster\n\
|
189 |
+
\ - typ: Fachverfahren\n - kurzbeschreibung: Historische handgezeichnete\
|
190 |
+
\ topographische Karten im Maßstab 1 : 25 000 des gesamten Staatsgebiets Preußens\
|
191 |
+
\ aus dem 19. Jahrhundert.\n - allgemeine_beschreibung: Die Preußischen Urmesstischblätter\
|
192 |
+
\ im Maßstab 1 : 25 000 wurden ab 1822 für das gesamte Staatsgebiet Preußens erstellt.\
|
193 |
+
\ Diese handgezeichneten Karten dienten als Grundlage für kleinere Kartenwerke\
|
194 |
+
\ und markieren den Beginn der topographischen Kartographie in Preußen. Die Karten\
|
195 |
+
\ sind heute als hochwertige Drucke verfügbar und bilden historische Landkarten\
|
196 |
+
\ ab.\n - fachliche_beschreibung: Die Preußischen Urmesstischblätter werden\
|
197 |
+
\ von der Landesvermessung und Geobasisinformation Brandenburg (LGB) erhoben und\
|
198 |
+
\ sind Teil der historischen Kartographie des Landes. Das Ministerium für Infrastruktur\
|
199 |
+
\ und Landesplanung des Landes Brandenburg hat die fachliche Aufsicht über die\
|
200 |
+
\ Erstellung und Bereitstellung dieser historischen Karten.\n - zweck: Die\
|
201 |
+
\ Preußischen Urmesstischblätter werden erhoben, um historische topographische\
|
202 |
+
\ Informationen über das Staatsgebiet Preußens im 19. Jahrhundert bereitzustellen.\
|
203 |
+
\ Sie dienen der Erforschung und Darstellung historischer Landnutzung, Siedlungsstrukturen\
|
204 |
+
\ und topographischer Gegebenheiten.\n - einfuehrungsjahr: 2024\n - aktualisierungsfrequenz:\
|
205 |
+
\ unbekannt\nDatenbestand hat Datenlieferanten\n - name: Landesvermessung und\
|
206 |
+
\ Geobasisinformation Brandenburg (LGB)\nDatenbestand hat Schlagwort\n - name:\
|
207 |
+
\ 125.000\n - name: Katasterverwaltung\n - name: Maßstab 1:25.000\n -\
|
208 |
+
\ name: historisch\n - name: vermessung\n - name: Topographie\n - name:\
|
209 |
+
\ Preußische Urmesstischblätter\n - name: opendata\n - name: bodenbedeckung\n\
|
210 |
+
\ - name: karte\n - name: Historische Karten\n - name: Geobasisinformation\n\
|
211 |
+
\ - name: Landesvermessung\nDatenbestand hat Kategorie\n - name: Wissenschaft\
|
212 |
+
\ und Technologie\n - name: Fischerei\n - name: Umwelt\n - name: Regierung\
|
213 |
+
\ und öffentlicher Sektor\n - name: Regionen und Städte\n - name: Landwirtschaft\n\
|
214 |
+
\ - name: Forstwirtschaft und Nahrungsmittel\nDatenbestand hat Ministerium\n\
|
215 |
+
Ministerium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n\
|
216 |
+
\ - kurzbezeichnung: BMI\n - ressorts: Landesvermessung und Geobasisinformation\
|
217 |
+
\ Brandenburg (LGB)\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Landesvermessung\
|
218 |
+
\ und Geobasisinformation Brandenburg (LGB)\n - kurzbezeichnung: LGB\n -\
|
219 |
+
\ themen: Vermessung, Geobasisinformation, Katasterverwaltung\n - ministerium_des_geschaeftsbereichs:\
|
220 |
+
\ Ministerium für Infrastruktur und Landesplanung des Landes Brandenburg\n \
|
221 |
+
\ - ressort: Landesvermessung, Geoinformation\nDatenbestand hat Gesetze:\nGesetz\n\
|
222 |
+
\ - bezeichnung: Gesetz über die Landesvermessung und Geobasisinformation Brandenburg\
|
223 |
+
\ (VermGeoG Bbg)\n - kurzbezeichnung: VermGeoG Bbg\nDatenbestand hat Verordnung\n\
|
224 |
+
Verordnung\n - bezeichnung: Verordnung über die Geodateninfrastruktur Brandenburg\
|
225 |
+
\ (GeoDINV Bbg)\n - kurzbezeichnung: GeoDINV Bbg\nVerordnung\n - bezeichnung:\
|
226 |
+
\ Instruction für die topographischen Arbeiten des Königlich Preußischen Generalstabes\
|
227 |
+
\ von 1821\n - kurzbezeichnung: Instruction 1821\nVerordnung\n - bezeichnung:\
|
228 |
+
\ Erläuterungen zu den Musterblättern für die topographischen Arbeiten des Königlich\
|
229 |
+
\ Preußischen Generalstabes\n - kurzbezeichnung: Erläuterungen Musterblätter\n"
|
230 |
+
- "\nDatenbestand\n - titel: Kindertagesstätten\n - typ: Fachverfahren\n \
|
231 |
+
\ - kurzbeschreibung: Stammdaten aller Kindertagesstätten in Schleswig-Holstein\
|
232 |
+
\ mit Informationen wie Einrichtungsnummer, Adresse, pädagogischem Konzept, Trägername\
|
233 |
+
\ und Betreuungsalter.\n - allgemeine_beschreibung: Der Datensatz 'Kindertagesstätten'\
|
234 |
+
\ enthält die Stammdaten aller Kindertagesstätten, die im KitaPortal Schleswig-Holstein\
|
235 |
+
\ enthalten sind. Die Daten umfassen Informationen wie die eindeutige Nummer der\
|
236 |
+
\ Einrichtung, die Anschrift, barrierefreien Zugang, pädagogisches Konzept, Trägername,\
|
237 |
+
\ Betreuungsalter, Öffnungszeiten und mehr.\n - fachliche_beschreibung: Der\
|
238 |
+
\ Datensatz 'Kindertagesstätten' wird vom Ministerium für Soziales, Jugend, Familie,\
|
239 |
+
\ Senioren, Integration und Gleichstellung erhoben. Er enthält relevante Informationen\
|
240 |
+
\ über die Kindertagesstätten in Schleswig-Holstein und dient der Bereitstellung\
|
241 |
+
\ von wichtigen Daten für Eltern, Erziehungsberechtigte und Interessierte.\n \
|
242 |
+
\ - zweck: Der Datensatz wird erhoben, um Transparenz über die vorhandenen Kindertagesstätten\
|
243 |
+
\ in Schleswig-Holstein zu schaffen und Eltern sowie Erziehungsberechtigten bei\
|
244 |
+
\ der Suche nach passenden Betreuungseinrichtungen zu unterstützen.\n - einfuehrungsjahr:\
|
245 |
+
\ 2023\n - zeitliche_abdeckung_start: 2022-12-17T00:00:00\n - zeitliche_abdeckung_ende:\
|
246 |
+
\ 2023-01-17T00:00:00\nDatenbestand hat Datenlieferanten\n - name: Jugend\n\
|
247 |
+
\ - name: Familie\n - name: Senioren\n - name: Ministerium für Soziales\n\
|
248 |
+
\ - name: Integration und Gleichstellung\nDatenbestand hat Schlagwort\n \
|
249 |
+
\ - name: Barrierefreiheit\n - name: Kindertagespflege\n - name: kindergarten\n\
|
250 |
+
\ - name: kindertagestätten\n - name: tagespflege\n - name: Schleswig-Holstein\n\
|
251 |
+
\ - name: kitas\n - name: Pädagogisches Konzept\n - name: Kindergarten\n\
|
252 |
+
\ - name: Kita\n - name: Trägername\n - name: Betreuungsalter\n -\
|
253 |
+
\ name: kindertagespflege\n - name: kindertageseinrichtungen\n - name: Öffnungszeiten\n\
|
254 |
+
\ - name: kita\n - name: kindertagesstätte\n - name: Kindertageseinrichtungen\n\
|
255 |
+
Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
|
256 |
+
Datenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\n\
|
257 |
+
Ministerium\n - bezeichnung: Bundesministerium für Familie, Senioren, Frauen\
|
258 |
+
\ und Jugend\n - kurzbezeichnung: BMFSFJ\n - ressorts: Ministerium für Soziales,\
|
259 |
+
\ Jugend, Familie, Senioren, Integration und Gleichstellung\nDatenbestand hat\
|
260 |
+
\ Behörde\nBehoerde\n - bezeichnung: Ministerium für Soziales, Jugend, Familie,\
|
261 |
+
\ Senioren, Integration und Gleichstellung\n - kurzbezeichnung: MSJFSIG\n \
|
262 |
+
\ - ministerium_des_geschaeftsbereichs: Ministerium für Soziales, Jugend, Familie,\
|
263 |
+
\ Senioren, Integration und Gleichstellung des Landes Schleswig-Holstein\n \
|
264 |
+
\ - ressort: Soziales\nDatenbestand hat Gesetze:\nGesetz\n - absatz: Teil 2\n\
|
265 |
+
\ - bezeichnung: Kindertagesstättengesetz Schleswig-Holstein\n - kurzbezeichnung:\
|
266 |
+
\ KiTaG SH\n - paragraph: § 4\nGesetz\n - bezeichnung: KiTa-Qualitätsgesetz\n\
|
267 |
+
Datenbestand hat Verordnung\nVerordnung\n - referenz: http://www.schure.de/21130/dvo-nkitag.htm\n\
|
268 |
+
\ - bezeichnung: Verordnung zur Durchführung des Niedersächsischen Gesetzes\
|
269 |
+
\ über Kindertagesstätten und Kindertagespflege\n - kurzbezeichnung: DVO-NKiTaG\n"
|
270 |
+
- source_sentence: In welchen Datenbeständen sind statistische Auswertungen aus dem
|
271 |
+
Sterberegister von Roetgen für 2020 enthalten gemäß dem Gesetz zum Schutz vor
|
272 |
+
Luftverunreinigung, Geräuschen?
|
273 |
+
sentences:
|
274 |
+
- "\nDatenbestand\n - titel: Datenbanken Beschäftigungsstatistik\n - typ:\
|
275 |
+
\ Fachverfahren\n - kurzbeschreibung: Monatliche Beschäftigtenkennzahlen nach\
|
276 |
+
\ soziodemographischen Merkmalen und Berufen in Deutschland.\n - allgemeine_beschreibung:\
|
277 |
+
\ Die Datenbanken Beschäftigungsstatistik enthalten monatliche Beschäftigtenkennzahlen\
|
278 |
+
\ nach soziodemographischen Merkmalen sowie der Klassifikation der Berufe. Die\
|
279 |
+
\ Datenbanken werden quartalsweise mit Monatsdaten aktualisiert und bieten einen\
|
280 |
+
\ umfassenden Überblick über die Beschäftigungssituation in Deutschland.\n \
|
281 |
+
\ - fachliche_beschreibung: Die Datenbanken Beschäftigungsstatistik werden von\
|
282 |
+
\ der Statistik der Bundesagentur für Arbeit geführt. Sie bieten detaillierte\
|
283 |
+
\ Informationen über die Beschäftigungssituation in Deutschland und werden quartalsweise\
|
284 |
+
\ mit aktuellen Monatsdaten aktualisiert. Die Daten dienen als Grundlage für Analysen\
|
285 |
+
\ zur Entwicklung des Arbeitsmarktes und der Beschäftigungsdynamik. Zu den relevanten\
|
286 |
+
\ Behörden gehören die Bundesagentur für Arbeit und das Bundesministerium für\
|
287 |
+
\ Arbeit und Soziales.\n - zweck: Der Datensatz wird erhoben, um detaillierte\
|
288 |
+
\ Einblicke in die Beschäftigungssituation in Deutschland zu ermöglichen. Er dient\
|
289 |
+
\ der Analyse von Trends in der Beschäftigung nach verschiedenen Merkmalen wie\
|
290 |
+
\ Alter, Geschlecht, Beruf und Staatsangehörigkeit.\nDatenbestand hat Datenlieferanten\n\
|
291 |
+
\ - name: Statistik der Bundesagentur für Arbeit\nDatenbestand hat Schlagwort\n\
|
292 |
+
\ - name: Arbeitszeit\n - name: Ausschließlich geringfügig Beschäftigte\n\
|
293 |
+
\ - name: Staatsangehörigkeit\n - name: Sozialversicherungspflichtig beschäftigte\
|
294 |
+
\ Auszubildende\n - name: Geschlecht\n - name: Beschäftigung\n - name:\
|
295 |
+
\ Berufe\n - name: Beschäftigte\n - name: Sozialversicherungspflichtig Beschäftigte\n\
|
296 |
+
\ - name: Geringfügig Beschäftigte\n - name: Geringfügig Beschäftigte im\
|
297 |
+
\ Nebenjob\n - name: Alter\nDatenbestand hat Kategorie\n - name: Wirtschaft\
|
298 |
+
\ und Finanzen\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat politische\
|
299 |
+
\ Ebenen\n - name: Bundesebene\nDatenbestand hat geografische Abdeckung\n \
|
300 |
+
\ - name: Kreise\n - name: Deutschland\n - name: Länder\nDatenbestand\
|
301 |
+
\ hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium für Arbeit\
|
302 |
+
\ und Soziales\n - kurzbezeichnung: BMAS\n - ressorts: Statistik der Bundesagentur\
|
303 |
+
\ für Arbeit\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesagentur\
|
304 |
+
\ für Arbeit (BA)\n - kurzbezeichnung: BA\n - themen: Arbeitsmarkt, Beschäftigungsstatistik,\
|
305 |
+
\ Ressortstatistiken\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
|
306 |
+
\ für Arbeit und Soziales\n - ressort: Bundesagentur für Arbeit\nDatenbestand\
|
307 |
+
\ hat Gesetze:\nGesetz\n - bezeichnung: Verdienststatistikgesetz\n - paragraph:\
|
308 |
+
\ § 4\nDatenbestand hat Verordnung\nVerordnung\n - referenz: SR 431.012.1\n\
|
309 |
+
\ - bezeichnung: Verordnung vom 30. Juni 1993 über statistische Erhebungen\n\
|
310 |
+
Verordnung\n - referenz: Entwurf eines Gesetzes zur Einführung eines Registerzensus\n\
|
311 |
+
\ - bezeichnung: Registerzensusgesetz\n"
|
312 |
+
- "\nDatenbestand\n - titel: Wahllokale in Lübeck zur Europawahl 2024\n -\
|
313 |
+
\ typ: Fachverfahren\n - kurzbeschreibung: Georeferenzierter Datensatz der\
|
314 |
+
\ Wahllokale in Lübeck zur Europawahl 2024.\n - allgemeine_beschreibung: Der\
|
315 |
+
\ Datensatz enthält georeferenzierte Informationen zu den Wahllokalen in der Hansestadt\
|
316 |
+
\ Lübeck für die Europawahl am 9. Juni 2024. Enthalten sind Angaben wie Wahlbezirksnummer,\
|
317 |
+
\ Name des Wahllokals, Adresse, Hinweise zum Wahllokal, Barrierefreiheit und Koordinaten.\n\
|
318 |
+
\ - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung der\
|
319 |
+
\ Hansestadt Lübeck bereitgestellt und enthält Informationen zu den Wahllokalen,\
|
320 |
+
\ die für die Europawahl am 9. Juni 2024 relevant sind. Die Daten werden im Fachverfahren\
|
321 |
+
\ der Kommunalverwaltung verwaltet und dienen der Unterstützung des Wahlprozesses\
|
322 |
+
\ in Lübeck.\n - zweck: Der Datensatz wird erhoben, um den Bürgern von Lübeck\
|
323 |
+
\ die Standorte der Wahllokale für die Europawahl 2024 zugänglich zu machen und\
|
324 |
+
\ ihnen eine barrierefreie Teilnahme zu ermöglichen.\n - einfuehrungsjahr:\
|
325 |
+
\ 2024\n - zeitliche_abdeckung_start: 2024-06-09T00:00:00\n - zeitliche_abdeckung_ende:\
|
326 |
+
\ 2024-06-09T00:00:00\nDatenbestand hat Datenlieferanten\n - name: Hansestadt\
|
327 |
+
\ Lübeck\nDatenbestand hat Schlagwort\n - name: barrierefreiheit\n - name:\
|
328 |
+
\ wahlbezirk\n - name: wahllokal\n - name: wahl\n - name: stimmbezirk\n\
|
329 |
+
Datenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\nDatenbestand\
|
330 |
+
\ hat Ministerium\nMinisterium\n - bezeichnung: Hansestadt Lübeck\nDatenbestand\
|
331 |
+
\ hat Behörde\nBehoerde\n - bezeichnung: Hansestadt Lübeck\n - kurzbezeichnung:\
|
332 |
+
\ Stadtverwaltung\n - themen: Stadtverwaltung, Kommunalverwaltung, Bürgerservice\n\
|
333 |
+
\ - ministerium_des_geschaeftsbereichs: Innenministerium des Landes Schleswig-Holstein\n\
|
334 |
+
\ - ressort: Kommunale Verwaltung\nDatenbestand hat Gesetze:\nGesetz\n -\
|
335 |
+
\ bezeichnung: Europawahlgesetz\nDatenbestand hat Verordnung\nVerordnung\n \
|
336 |
+
\ - bezeichnung: Datenschutzgrundverordnung (DSGVO)\n - kurzbezeichnung: DSGVO\n\
|
337 |
+
Verordnung\n - bezeichnung: Europawahlordnung\n"
|
338 |
+
- "\nDatenbestand\n - titel: Auswertungen aus dem Sterberegister der Gemeinde\
|
339 |
+
\ Roetgen\n - typ: Fachverfahren\n - kurzbeschreibung: Auswertungen aus\
|
340 |
+
\ dem Sterberegister der Gemeinde Roetgen, Jahr 2020.\n - allgemeine_beschreibung:\
|
341 |
+
\ Der Datensatz enthält Auswertungen aus dem Sterberegister der Gemeinde Roetgen,\
|
342 |
+
\ speziell aus dem Jahr 2020. Die Daten werden jährlich aktualisiert und sind\
|
343 |
+
\ über das GovData Portal verfügbar.\n - fachliche_beschreibung: Der Datensatz\
|
344 |
+
\ wird von der Stadt Aachen bereitgestellt und enthält statistische Auswertungen\
|
345 |
+
\ aus dem Sterberegister der Gemeinde Roetgen. Die Daten dienen der Analyse von\
|
346 |
+
\ Sterbefällen in der Gemeinde und werden unter der fachlichen Aufsicht des Bundesministeriums\
|
347 |
+
\ des Innern und für Heimat veröffentlicht.\n - zweck: Der Datensatz wird erhoben,\
|
348 |
+
\ um Einblicke in Sterbefälle und statistische Auswertungen im Bereich der Gemeinde\
|
349 |
+
\ Roetgen zu ermöglichen.\n - einfuehrungsjahr: 2024\nDatenbestand hat Datenlieferanten\n\
|
350 |
+
\ - name: Aachen\nDatenbestand hat Schlagwort\n - name: sterbefälle\n \
|
351 |
+
\ - name: auswertungen\n - name: Sterbefälle\n - name: Auswertungen\n \
|
352 |
+
\ - name: GovData Portal\n - name: Statistiken\n - name: roetgen\n \
|
353 |
+
\ - name: Jahresbericht\n - name: Gemeinde Roetgen\nDatenbestand hat Kategorie\n\
|
354 |
+
\ - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n\
|
355 |
+
\ - name: Bevölkerung und Gesellschaft\nDatenbestand hat Ministerium\nMinisterium\n\
|
356 |
+
\ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
|
357 |
+
\ BMI\n - ressorts: Stadt Aachen, StädteRegion Aachen, Rathaus Aachen\nDatenbestand\
|
358 |
+
\ hat Behörde\nBehoerde\n - bezeichnung: Stadt Aachen\n - kurzbezeichnung:\
|
359 |
+
\ Stadtverwaltung Aachen\n - ministerium_des_geschaeftsbereichs: Ministerium\
|
360 |
+
\ des Innern\n - ressort: Kommunales\nDatenbestand hat Gesetze:\nGesetz\n \
|
361 |
+
\ - bezeichnung: Gesetz zum Schutz vor Luftverunreinigung, Geräuschen\n -\
|
362 |
+
\ paragraph: § 5 Abs. 1; 7 Abs. 1; 9 Abs. 3; 10 Abs. 4\nDatenbestand hat Verordnung\n\
|
363 |
+
Verordnung\n - referenz: https://www.roetgen.de/wp-content/uploads/2018/06/Ordnungsbeh%C3%B6rdliche-Verordnung-%C3%BCber-die-Aufrechterhaltung-der-%C3%B6ffentlichen-Sicherheit-und-Ordnung.pdf\n\
|
364 |
+
\ - bezeichnung: Ordnungsbehördliche Verordnung - Gemeinde Roetgen\nVerordnung\n\
|
365 |
+
\ - referenz: https://buergerportal.roetgen.de/detail/-/vr-bis-detail/dienstleistung/659/show\n\
|
366 |
+
\ - bezeichnung: Personenstandsurkunden Aufbewahrungsfristen\n"
|
367 |
+
- source_sentence: Welche Datenquellen des BStU bieten Einblicke in die Antragszahlen
|
368 |
+
und Verwendungszwecke für Stasi-Unterlagen?
|
369 |
+
sentences:
|
370 |
+
- "\nDatenbestand\n - titel: Entwicklung der Antragszahlen nach Verwendungszweck\n\
|
371 |
+
\ - typ: Fachverfahren\n - kurzbeschreibung: Anzahl der Anträge und Ersuchen\
|
372 |
+
\ an die Stasi-Unterlagen-Behörde (BStU) nach Verwendungszweck und Jahren gemäß\
|
373 |
+
\ Stasi-Unterlagen-Gesetz (StUG).\n - allgemeine_beschreibung: Der Datensatz\
|
374 |
+
\ bietet eine Übersicht über die Anzahl der an die Stasi-Unterlagen-Behörde (BStU)\
|
375 |
+
\ gestellten Anträge und Ersuchen, aufgeschlüsselt nach Jahren und den jeweiligen\
|
376 |
+
\ Verwendungszwecken gemäß Stasi-Unterlagen-Gesetz (StUG). Die Daten werden vom\
|
377 |
+
\ Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen\
|
378 |
+
\ Deutschen Demokratischen Republik (BStU) bereitgestellt und sind über das FITKO\
|
379 |
+
\ (Föderale IT-Kooperation) – GovData Portal verfügbar.\n - fachliche_beschreibung:\
|
380 |
+
\ Der Datensatz wird vom Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes\
|
381 |
+
\ der ehemaligen Deutschen Demokratischen Republik (BStU) bereitgestellt. Die\
|
382 |
+
\ Behörde ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt\
|
383 |
+
\ und hat den Auftrag, die Unterlagen des ehemaligen Staatssicherheitsdienstes\
|
384 |
+
\ der DDR zu sichern, zu erforschen und der Öffentlichkeit zugänglich zu machen.\
|
385 |
+
\ Die Antragszahlen geben Einblicke in das Interesse an der Aufarbeitung der Stasi-Unterlagen\
|
386 |
+
\ und dienen der historischen Forschung sowie der Erinnerungskultur.\n - zweck:\
|
387 |
+
\ Der Datensatz wird erhoben, um Transparenz über die Anzahl und die Verwendungszwecke\
|
388 |
+
\ der gestellten Anträge und Ersuchen an die Stasi-Unterlagen-Behörde zu schaffen.\
|
389 |
+
\ Dies dient der Aufarbeitung von Unterlagen des Staatssicherheitsdienstes der\
|
390 |
+
\ ehemaligen DDR und ermöglicht es Forschern, Historikern und der interessierten\
|
391 |
+
\ Öffentlichkeit Einblicke in die Aktivitäten der Stasi zu erhalten.\n - einfuehrungsjahr:\
|
392 |
+
\ 2014\nDatenbestand hat Datenlieferanten\n - name: Der Bundesbeauftragte für\
|
393 |
+
\ die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratsichen\
|
394 |
+
\ Republik (BStU)\nDatenbestand hat Schlagwort\n - name: anträge\n - name:\
|
395 |
+
\ antrag\n - name: stug\n - name: staatssicherheit\n - name: ersuchen\n\
|
396 |
+
\ - name: aufarbeitung\n - name: auskunft\n - name: stasi\n - name:\
|
397 |
+
\ ddr\n - name: akteneinsicht\n - name: mfs\n - name: stasi-unterlagen\n\
|
398 |
+
Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
|
399 |
+
\ - name: Wissenschaft und Technologie\nDatenbestand hat Ministerium\nMinisterium\n\
|
400 |
+
\ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
|
401 |
+
\ BMI\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Der Bundesbeauftragte\
|
402 |
+
\ für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen\
|
403 |
+
\ Republik (BStU)\n - kurzbezeichnung: BStU\n - themen: Staatssicherheitsdienst,\
|
404 |
+
\ Unterlagen, DDR\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
|
405 |
+
\ des Innern, für Bau und Heimat\n - ressort: Bundesbeauftragter für die Stasi-Unterlagen\n\
|
406 |
+
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Stasi-Unterlagen-Gesetz\n\
|
407 |
+
\ - kurzbezeichnung: StUG\nDatenbestand hat Verordnung\nVerordnung\n - referenz:\
|
408 |
+
\ https://www.bundesgesundheitsministerium.de/fileadmin/Dateien/3_Downloads/Gesetze_und_Verordnungen/GuV/D/VO_Datentransparenzverordnung.pdf\n\
|
409 |
+
\ - bezeichnung: VO_Datentransparenzverordnung\n"
|
410 |
+
- "\nDatenbestand\n - titel: UAV-Lärmmessdaten des RauMoLeS-Projekts\n - typ:\
|
411 |
+
\ Fachverfahren\n - kurzbeschreibung: Lärmmessdaten von UAVs im RauMoLeS-Projekt,\
|
412 |
+
\ inklusive Positionen der Messmikrofone und UAVs, Propellerdrehzahlen und elektrische\
|
413 |
+
\ Gesamtsystemleistung.\n - allgemeine_beschreibung: Der Datensatz enthält\
|
414 |
+
\ Lärmmessdaten von UAVs im Rahmen des RauMoLeS-Projekts. Es gibt Messdaten für\
|
415 |
+
\ das UAV \"Manta Ray\" und drei verschiedene Konfigurationen des UAV \"Minitalon\"\
|
416 |
+
. Die Daten umfassen die Positionen der Messmikrofone und der UAVs, sowie Propellerdrehzahlen\
|
417 |
+
\ und die elektrische Gesamtsystemleistung der UAVs.\n - fachliche_beschreibung:\
|
418 |
+
\ Der Datensatz wird vom Lehrstuhl für Luftfahrtsysteme der Technischen Universität\
|
419 |
+
\ München und der Phoenix-Wings GmbH bereitgestellt. Er dient der Erfassung und\
|
420 |
+
\ Analyse von Lärmemissionen von UAVs, insbesondere im Bereich der Luftfahrt.\
|
421 |
+
\ Das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) ist die\
|
422 |
+
\ zuständige Behörde für Luftfahrtthemen.\n - zweck: Der Datensatz wurde erhoben,\
|
423 |
+
\ um Lärmdaten von UAVs zu sammeln und zu analysieren, insbesondere im Hinblick\
|
424 |
+
\ auf die Auswirkungen auf die Umwelt und die Bevölkerung. Die Daten dienen der\
|
425 |
+
\ Forschung und Entwicklung im Bereich der Luftfahrt.\n - einfuehrungsjahr:\
|
426 |
+
\ 2020\nDatenbestand hat Datenlieferanten\n - name: Prof. Schaller UmweltConsult\
|
427 |
+
\ GmbH\n - name: 2020\n - name: 2020 Flugmessdaten: Phoenix-Wings GmbH\n\
|
428 |
+
\ - name: Technische Universität München\n - name: Lärmdaten: Lehrstuhl\
|
429 |
+
\ für Luftfahrtsysteme\nDatenbestand hat Schlagwort\n - name: Minitalon\n \
|
430 |
+
\ - name: Manta Ray\n - name: mcloud_category_aviation\n - name: mfund-projekt-raumoles\n\
|
431 |
+
\ - name: Propellerdrehzahlen\n - name: mcloud_idd46c56b5-c70e-4fc9-bd54-b62d82db146e\n\
|
432 |
+
\ - name: UAVs\n - name: Gesamtsystemleistung\n - name: Luftfahrt\n \
|
433 |
+
\ - name: Lärmdaten\n - name: RauMoLeS-Projekt\nDatenbestand hat Kategorie\n\
|
434 |
+
\ - name: Verkehr\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
|
435 |
+
\ Bundesministerium für Verkehr und digitale Infrastruktur\n - kurzbezeichnung:\
|
436 |
+
\ BMDV\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesministerium\
|
437 |
+
\ für Verkehr und digitale Infrastruktur\n - kurzbezeichnung: BMVI\n - themen:\
|
438 |
+
\ Lärmdaten, Flugmessdaten\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
|
439 |
+
\ für Verkehr und digitale Infrastruktur\n - ressort: Luftfahrt\nDatenbestand\
|
440 |
+
\ hat Gesetze:\nGesetz\n - bezeichnung: Bundes-Immissionsschutzgesetz\n \
|
441 |
+
\ - kurzbezeichnung: BImSchG\n - paragraph: 34\nDatenbestand hat Verordnung\n\
|
442 |
+
Verordnung\n - referenz: https://www.mcloud.de/export/csv/datasets?page=1&pageSize=198&sortOrder=desc&sortField=latest&aggs=categories%3Aaviation\n\
|
443 |
+
\ - bezeichnung: Verordnung zur Durchführung des Bundes-Immissionsschutzgesetzes\n\
|
444 |
+
\ - kurzbezeichnung: 34. BImSchV\n"
|
445 |
+
- "\nDatenbestand\n - titel: Kindertageseinrichtungen in Neckarsulm\n - typ:\
|
446 |
+
\ Fachverfahren\n - kurzbeschreibung: Standorte, Öffnungszeiten und weitere\
|
447 |
+
\ Infos zu Kindertageseinrichtungen in Neckarsulm.\n - allgemeine_beschreibung:\
|
448 |
+
\ Der Datensatz enthält Informationen zu den Standorten, Öffnungszeiten und weiteren\
|
449 |
+
\ Details der Kindertageseinrichtungen in Neckarsulm.\n - fachliche_beschreibung:\
|
450 |
+
\ Der Datensatz wird vom Amt für Stadtentwicklung und Gebäudewirtschaft, Stadtplanung\
|
451 |
+
\ und GIS der Stadt Neckarsulm bereitgestellt. Er enthält relevante Informationen\
|
452 |
+
\ zu den Kindertageseinrichtungen in der Stadt, um Transparenz zu schaffen und\
|
453 |
+
\ Eltern bei der Suche nach einer geeigneten Einrichtung zu unterstützen.\n \
|
454 |
+
\ - zweck: Der Datensatz wird erhoben, um Eltern und Erziehungsberechtigten einen\
|
455 |
+
\ Überblick über die verfügbaren Kindertageseinrichtungen in Neckarsulm zu geben\
|
456 |
+
\ und sie bei der Auswahl einer passenden Einrichtung zu unterstützen.\n -\
|
457 |
+
\ einfuehrungsjahr: 2023\nDatenbestand hat Datenlieferanten\n - name: Stadtplanung\
|
458 |
+
\ und GIS\n - name: Amt für Stadtentwicklung und Gebäudewirtschaft\nDatenbestand\
|
459 |
+
\ hat Schlagwort\n - name: Kindertageseinrichtung\n - name: GIS\n - name:\
|
460 |
+
\ Stadtplanung\n - name: Neckarsulm\n - name: kindertageseinrichtung\n \
|
461 |
+
\ - name: Gebäudewirtschaft\n - name: Kita\n - name: Öffnungszeiten\n\
|
462 |
+
\ - name: kita\n - name: Standorte\n - name: Stadtentwicklung\nDatenbestand\
|
463 |
+
\ hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\nDatenbestand\
|
464 |
+
\ hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium für Wohnen,\
|
465 |
+
\ Stadtentwicklung und Bauwesen\n - kurzbezeichnung: BMWSB\nDatenbestand hat\
|
466 |
+
\ Behörde\nBehoerde\n - bezeichnung: Amt für Stadtentwicklung und Gebäudewirtschaft,\
|
467 |
+
\ Stadtplanung und GIS\n - kurzbezeichnung: Stadtentwicklung und Bauamt\n \
|
468 |
+
\ - themen: Stadtentwicklung, Gebäudewirtschaft, Stadtplanung, GIS\n - ministerium_des_geschaeftsbereichs:\
|
469 |
+
\ Bundesministerium des Innern, für Bau und Heimat\n - ressort: Stadtentwicklung,\
|
470 |
+
\ Bau und Wohnungswesen\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung:\
|
471 |
+
\ Gesetz zur Bildung, Erziehung und Betreuung von Kindern in Kindertageseinrichtungen\
|
472 |
+
\ und in Tagespflege (BayKiBiG)\n - kurzbezeichnung: BayKiBiG\nGesetz\n \
|
473 |
+
\ - bezeichnung: Kindertagesstättengesetz (KitaG)\n - kurzbezeichnung: KitaG\n\
|
474 |
+
Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.landesrecht-bw.de/bsbw/document/jlr-KiTaVBWV6P1\n\
|
475 |
+
\ - bezeichnung: Verordnung des Kultusministeriums über den Mindestpersonalschlüssel\
|
476 |
+
\ und die Personalfortbildung in Kindergärten und Tageseinrichtungen mit altersgemischten\
|
477 |
+
\ Gruppen (KiTaVO)\n - kurzbezeichnung: KiTaVO\nVerordnung\n - referenz:\
|
478 |
+
\ https://www.bmfsfj.de/bmfsfj/themen/familie/kinderbetreuung/fuer-gute-kinderbetreuung-bundesweit-das-kita-qualitaetsgesetz-209046\n\
|
479 |
+
\ - bezeichnung: KiTa-Qualitätsgesetz\n - kurzbezeichnung: KiTa-Qualitätsgesetz\n"
|
480 |
+
- source_sentence: Welche Datenbestände dokumentieren die Fachaufsicht des BMI über
|
481 |
+
Kinderbetreuungseinrichtungen in der Stadt Oberhof?
|
482 |
+
sentences:
|
483 |
+
- "\nDatenbestand\n - titel: Luftbild 2002\n - typ: Fachverfahren\n - kurzbeschreibung:\
|
484 |
+
\ Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und\
|
485 |
+
\ Umgebung von März und April 2002.\n - allgemeine_beschreibung: Der Datensatz\
|
486 |
+
\ 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt\
|
487 |
+
\ Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16\
|
488 |
+
\ Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n - fachliche_beschreibung:\
|
489 |
+
\ Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt,\
|
490 |
+
\ speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer\
|
491 |
+
\ Luftbilder für die Öffentlichkeit.\n - zweck: Der Datensatz wird erhoben,\
|
492 |
+
\ um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung\
|
493 |
+
\ aus dem Jahr 2002 bereitzustellen.\n - einfuehrungsjahr: 2017\n - zeitliche_abdeckung_start:\
|
494 |
+
\ 2002-03-01T00:00:00+01:00\n - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\n\
|
495 |
+
Datenbestand hat Datenlieferanten\n - name: Hanse- und Universitätsstadt Rostock\n\
|
496 |
+
Datenbestand hat Schlagwort\n - name: luftbild\n - name: Historisch\n \
|
497 |
+
\ - name: Digitales Orthophoto\n - name: 2002\n - name: Bodenauflösung\n\
|
498 |
+
\ - name: Rostock\n - name: Luftbild\n - name: Hanse- und Universitätsstadt\n\
|
499 |
+
Datenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\n \
|
500 |
+
\ - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n - name:\
|
501 |
+
\ Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n\
|
502 |
+
\ - name: Rostock\n - name: Hanse- und Universitätsstadt\nDatenbestand hat\
|
503 |
+
\ Sprache\n - name: Deutsch\nDatenbestand hat geografische Abdeckung\n -\
|
504 |
+
\ name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n -\
|
505 |
+
\ bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
|
506 |
+
\ BMI\n - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat\
|
507 |
+
\ Behörde\nBehoerde\n - bezeichnung: Hanse- und Universitätsstadt Rostock\n\
|
508 |
+
\ - kurzbezeichnung: Rostock\n - themen: Kommunalverwaltung, Stadtentwicklung,\
|
509 |
+
\ Öffentliche Ordnung\n - ministerium_des_geschaeftsbereichs: Ministerium für\
|
510 |
+
\ Inneres und Europa Mecklenburg-Vorpommern\n - ressort: Kommunalaufsicht\n\
|
511 |
+
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Bundesdatenschutzgesetz\n\
|
512 |
+
\ - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n - referenz:\
|
513 |
+
\ https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n\
|
514 |
+
\ - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und\
|
515 |
+
\ Ausführung von Luftbildern\nVerordnung\n - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n\
|
516 |
+
\ - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n"
|
517 |
+
- "\nDatenbestand\n - titel: Bebauungspläne\n - typ: Fachverfahren\n -\
|
518 |
+
\ kurzbeschreibung: Der Datensatz enthält Bebauungspläne der Ortsgemeinde Wintrich,\
|
519 |
+
\ die die Nutzung von Grundstücken in bestimmten Gebieten regeln.\n - allgemeine_beschreibung:\
|
520 |
+
\ Der Datensatz umfasst Bebauungspläne, die von der Ortsgemeinde Wintrich bereitgestellt\
|
521 |
+
\ werden. Bebauungspläne sind Satzungen, die von Gemeinden beschlossen werden\
|
522 |
+
\ und die beabsichtigte Bodennutzung in einem bestimmten Gebiet regeln.\n -\
|
523 |
+
\ fachliche_beschreibung: Die Ortsgemeinde Wintrich stellt Bebauungspläne bereit,\
|
524 |
+
\ die im Rahmen der Bauleitplanung gemäß dem Baugesetzbuch (BauGB) erstellt werden.\
|
525 |
+
\ Die Bebauungspläne werden als Satzungen von der Gemeinde beschlossen und regeln\
|
526 |
+
\ die Art der baulichen Nutzung sowie die städtebauliche Entwicklung in einem\
|
527 |
+
\ definierten Gebiet. Zuständig für die Verwaltung und Bereitstellung der Bebauungspläne\
|
528 |
+
\ ist die Kommunalverwaltung der Ortsgemeinde Wintrich.\n - zweck: Die Bebauungspläne\
|
529 |
+
\ dienen dazu, die bauliche und sonstige Nutzung von Grundstücken in einem definierten\
|
530 |
+
\ Gebiet zu regeln. Sie legen fest, welche Art von Bebauung zulässig ist und dienen\
|
531 |
+
\ der städtebaulichen Entwicklung und Ordnung.\n - einfuehrungsjahr: 2022\n\
|
532 |
+
Datenbestand hat Datenlieferanten\n - name: Ortsgemeinde Wintrich\nDatenbestand\
|
533 |
+
\ hat Schlagwort\n - name: Ortsgemeinde Wintrich\n - name: städtebauliche\
|
534 |
+
\ Entwicklung\n - name: Bebauungspläne\n - name: Baugesetzbuch\n - name:\
|
535 |
+
\ Bauleitplanung\n - name: Satzungen\nDatenbestand hat Kategorie\n - name:\
|
536 |
+
\ Regierung und öffentlicher Sektor\nDatenbestand hat Sprache\n - name: http://publications.europa.eu/resource/authority/language/GER\n\
|
537 |
+
Datenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium\
|
538 |
+
\ des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Ortsgemeinde\
|
539 |
+
\ Wintrich\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Ortsgemeinde\
|
540 |
+
\ Wintrich\n - kurzbezeichnung: Ortsgemeinde Wintrich\n - themen: Gemeindeverwaltung,\
|
541 |
+
\ Ortsrecht, Bürgerdienste\n - ministerium_des_geschaeftsbereichs: Ministerium\
|
542 |
+
\ des Innern, für Sport und Infrastruktur Rheinland-Pfalz\n - ressort: Kommunalverwaltung\n\
|
543 |
+
Datenbestand hat Gesetze:\nGesetz\n - absatz: (1) Die Gemeinde beschließt den\
|
544 |
+
\ Bebauungsplan als Satzung. (2) Bebauungspläne nach § 8 Absatz ...\n - bezeichnung:\
|
545 |
+
\ Baugesetzbuch (BauGB)\n - kurzbezeichnung: BauGB\n - paragraph: § 10\n\
|
546 |
+
Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.bmwsb.bund.de/SharedDocs/gesetzgebungsverfahren/Webs/BMWSB/DE/digitalisierung-im-bauleitverfahren.html\n\
|
547 |
+
\ - bezeichnung: Entwurf eines Gesetzes zur Stärkung der Digitalisierung\n\
|
548 |
+
\ - kurzbezeichnung: Digitalisierungsgesetz\nVerordnung\n - referenz: https://recht.nrw.de/lmi/owa/br_bes_text?print=1&anw_nr=1&gld_nr=%202&ugl_nr=2311&val=2493&ver=7&aufgehoben=J&keyword=&bes_id=2493&show_preview=1\n\
|
549 |
+
\ - bezeichnung: Verordnung zur Änderung der Baunutzungsverordnung\n - kurzbezeichnung:\
|
550 |
+
\ BauNVO\n"
|
551 |
+
- "\nDatenbestand\n - titel: Kindertagesstätten der Stadt Oberhof\n - typ:\
|
552 |
+
\ Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen\
|
553 |
+
\ der Stadt Oberhof.\n - allgemeine_beschreibung: Der Datensatz zeigt die Standorte\
|
554 |
+
\ von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen\
|
555 |
+
\ Sekundärdatenbestand.\n - fachliche_beschreibung: Der Datensatz wird von\
|
556 |
+
\ der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen\
|
557 |
+
\ in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof\
|
558 |
+
\ und das Thüringer Ministerium für Inneres und Kommunales.\n - zweck: Der\
|
559 |
+
\ Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren\
|
560 |
+
\ Kindertagesstätten und Kinderkrippen bereitzustellen.\n - aktualisierungsfrequenz:\
|
561 |
+
\ http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
|
562 |
+
Datenbestand hat Datenlieferanten\n - name: Stadt Oberhof\nDatenbestand hat\
|
563 |
+
\ Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n -\
|
564 |
+
\ name: kindertagesstätten\n - name: kindergarten\n - name: kinderbetreuung\n\
|
565 |
+
\ - name: thüringen\n - name: opendata\n - name: kinderkrippe\n -\
|
566 |
+
\ name: kita\nDatenbestand hat Kategorie\n - name: Bildung\n - name: Kultur\
|
567 |
+
\ und Sport\n - name: Regierung und öffentlicher Sektor\n - name: Regionen\
|
568 |
+
\ und Städte\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n\
|
569 |
+
\ - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
|
570 |
+
\ Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n \
|
571 |
+
\ - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung:\
|
572 |
+
\ Stadtverwaltung Oberhof\n - kurzbezeichnung: Stadtverwaltung\n - themen:\
|
573 |
+
\ Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n - ministerium_des_geschaeftsbereichs:\
|
574 |
+
\ Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalverwaltung\n\
|
575 |
+
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n\
|
576 |
+
\ - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n \
|
577 |
+
\ - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n\
|
578 |
+
\ - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle\
|
579 |
+
\ für den automatisierten Datenaustausch\nVerordnung\n - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n\
|
580 |
+
\ - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung\
|
581 |
+
\ einer erfüllenden Gemeinde\n"
|
582 |
+
model-index:
|
583 |
+
- name: SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
|
584 |
+
results:
|
585 |
+
- task:
|
586 |
+
type: information-retrieval
|
587 |
+
name: Information Retrieval
|
588 |
+
dataset:
|
589 |
+
name: dim 512
|
590 |
+
type: dim_512
|
591 |
+
metrics:
|
592 |
+
- type: cosine_accuracy@1
|
593 |
+
value: 0.40814867762687634
|
594 |
+
name: Cosine Accuracy@1
|
595 |
+
- type: cosine_accuracy@3
|
596 |
+
value: 0.6311651179413867
|
597 |
+
name: Cosine Accuracy@3
|
598 |
+
- type: cosine_accuracy@5
|
599 |
+
value: 0.7176554681915654
|
600 |
+
name: Cosine Accuracy@5
|
601 |
+
- type: cosine_accuracy@10
|
602 |
+
value: 0.8077197998570408
|
603 |
+
name: Cosine Accuracy@10
|
604 |
+
- type: cosine_precision@1
|
605 |
+
value: 0.40814867762687634
|
606 |
+
name: Cosine Precision@1
|
607 |
+
- type: cosine_precision@3
|
608 |
+
value: 0.21038837264712884
|
609 |
+
name: Cosine Precision@3
|
610 |
+
- type: cosine_precision@5
|
611 |
+
value: 0.14353109363831304
|
612 |
+
name: Cosine Precision@5
|
613 |
+
- type: cosine_precision@10
|
614 |
+
value: 0.08077197998570407
|
615 |
+
name: Cosine Precision@10
|
616 |
+
- type: cosine_recall@1
|
617 |
+
value: 0.40814867762687634
|
618 |
+
name: Cosine Recall@1
|
619 |
+
- type: cosine_recall@3
|
620 |
+
value: 0.6311651179413867
|
621 |
+
name: Cosine Recall@3
|
622 |
+
- type: cosine_recall@5
|
623 |
+
value: 0.7176554681915654
|
624 |
+
name: Cosine Recall@5
|
625 |
+
- type: cosine_recall@10
|
626 |
+
value: 0.8077197998570408
|
627 |
+
name: Cosine Recall@10
|
628 |
+
- type: cosine_ndcg@10
|
629 |
+
value: 0.6045190659045919
|
630 |
+
name: Cosine Ndcg@10
|
631 |
+
- type: cosine_mrr@10
|
632 |
+
value: 0.5398677626876347
|
633 |
+
name: Cosine Mrr@10
|
634 |
+
- type: cosine_map@100
|
635 |
+
value: 0.5472345393824497
|
636 |
+
name: Cosine Map@100
|
637 |
+
---
|
638 |
+
|
639 |
+
# SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
|
640 |
+
|
641 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [mixedbread-ai/deepset-mxbai-embed-de-large-v1](https://huggingface.co/mixedbread-ai/deepset-mxbai-embed-de-large-v1). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
642 |
+
|
643 |
+
## Model Details
|
644 |
+
|
645 |
+
### Model Description
|
646 |
+
- **Model Type:** Sentence Transformer
|
647 |
+
- **Base model:** [mixedbread-ai/deepset-mxbai-embed-de-large-v1](https://huggingface.co/mixedbread-ai/deepset-mxbai-embed-de-large-v1) <!-- at revision fe450620a047ac704e100d84aebe7cd3fc137021 -->
|
648 |
+
- **Maximum Sequence Length:** 512 tokens
|
649 |
+
- **Output Dimensionality:** 1024 tokens
|
650 |
+
- **Similarity Function:** Cosine Similarity
|
651 |
+
<!-- - **Training Dataset:** Unknown -->
|
652 |
+
<!-- - **Language:** Unknown -->
|
653 |
+
<!-- - **License:** Unknown -->
|
654 |
+
|
655 |
+
### Model Sources
|
656 |
+
|
657 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
658 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
659 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
660 |
+
|
661 |
+
### Full Model Architecture
|
662 |
+
|
663 |
+
```
|
664 |
+
SentenceTransformer(
|
665 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
666 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
667 |
+
(2): Normalize()
|
668 |
+
)
|
669 |
+
```
|
670 |
+
|
671 |
+
## Usage
|
672 |
+
|
673 |
+
### Direct Usage (Sentence Transformers)
|
674 |
+
|
675 |
+
First install the Sentence Transformers library:
|
676 |
+
|
677 |
+
```bash
|
678 |
+
pip install -U sentence-transformers
|
679 |
+
```
|
680 |
+
|
681 |
+
Then you can load this model and run inference.
|
682 |
+
```python
|
683 |
+
from sentence_transformers import SentenceTransformer
|
684 |
+
|
685 |
+
# Download from the 🤗 Hub
|
686 |
+
model = SentenceTransformer("sentence_transformers_model_id")
|
687 |
+
# Run inference
|
688 |
+
sentences = [
|
689 |
+
'Welche Datenbestände dokumentieren die Fachaufsicht des BMI über Kinderbetreuungseinrichtungen in der Stadt Oberhof?',
|
690 |
+
'\nDatenbestand\n - titel: Kindertagesstätten der Stadt Oberhof\n - typ: Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof.\n - allgemeine_beschreibung: Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen Sekundärdatenbestand.\n - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof und das Thüringer Ministerium für Inneres und Kommunales.\n - zweck: Der Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren Kindertagesstätten und Kinderkrippen bereitzustellen.\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\nDatenbestand hat Datenlieferanten\n - name: Stadt Oberhof\nDatenbestand hat Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n - name: kindertagesstätten\n - name: kindergarten\n - name: kinderbetreuung\n - name: thüringen\n - name: opendata\n - name: kinderkrippe\n - name: kita\nDatenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Stadtverwaltung Oberhof\n - kurzbezeichnung: Stadtverwaltung\n - themen: Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n - ministerium_des_geschaeftsbereichs: Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalverwaltung\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle für den automatisierten Datenaustausch\nVerordnung\n - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung einer erfüllenden Gemeinde\n',
|
691 |
+
"\nDatenbestand\n - titel: Luftbild 2002\n - typ: Fachverfahren\n - kurzbeschreibung: Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002.\n - allgemeine_beschreibung: Der Datensatz 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16 Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt, speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer Luftbilder für die Öffentlichkeit.\n - zweck: Der Datensatz wird erhoben, um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung aus dem Jahr 2002 bereitzustellen.\n - einfuehrungsjahr: 2017\n - zeitliche_abdeckung_start: 2002-03-01T00:00:00+01:00\n - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\nDatenbestand hat Datenlieferanten\n - name: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Schlagwort\n - name: luftbild\n - name: Historisch\n - name: Digitales Orthophoto\n - name: 2002\n - name: Bodenauflösung\n - name: Rostock\n - name: Luftbild\n - name: Hanse- und Universitätsstadt\nDatenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n - name: Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n - name: Rostock\n - name: Hanse- und Universitätsstadt\nDatenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat geografische Abdeckung\n - name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Hanse- und Universitätsstadt Rostock\n - kurzbezeichnung: Rostock\n - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung\n - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern\n - ressort: Kommunalaufsicht\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Bundesdatenschutzgesetz\n - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n - referenz: https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und Ausführung von Luftbildern\nVerordnung\n - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n",
|
692 |
+
]
|
693 |
+
embeddings = model.encode(sentences)
|
694 |
+
print(embeddings.shape)
|
695 |
+
# [3, 1024]
|
696 |
+
|
697 |
+
# Get the similarity scores for the embeddings
|
698 |
+
similarities = model.similarity(embeddings, embeddings)
|
699 |
+
print(similarities.shape)
|
700 |
+
# [3, 3]
|
701 |
+
```
|
702 |
+
|
703 |
+
<!--
|
704 |
+
### Direct Usage (Transformers)
|
705 |
+
|
706 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
707 |
+
|
708 |
+
</details>
|
709 |
+
-->
|
710 |
+
|
711 |
+
<!--
|
712 |
+
### Downstream Usage (Sentence Transformers)
|
713 |
+
|
714 |
+
You can finetune this model on your own dataset.
|
715 |
+
|
716 |
+
<details><summary>Click to expand</summary>
|
717 |
+
|
718 |
+
</details>
|
719 |
+
-->
|
720 |
+
|
721 |
+
<!--
|
722 |
+
### Out-of-Scope Use
|
723 |
+
|
724 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
725 |
+
-->
|
726 |
+
|
727 |
+
## Evaluation
|
728 |
+
|
729 |
+
### Metrics
|
730 |
+
|
731 |
+
#### Information Retrieval
|
732 |
+
* Dataset: `dim_512`
|
733 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
734 |
+
|
735 |
+
| Metric | Value |
|
736 |
+
|:--------------------|:-----------|
|
737 |
+
| cosine_accuracy@1 | 0.4081 |
|
738 |
+
| cosine_accuracy@3 | 0.6312 |
|
739 |
+
| cosine_accuracy@5 | 0.7177 |
|
740 |
+
| cosine_accuracy@10 | 0.8077 |
|
741 |
+
| cosine_precision@1 | 0.4081 |
|
742 |
+
| cosine_precision@3 | 0.2104 |
|
743 |
+
| cosine_precision@5 | 0.1435 |
|
744 |
+
| cosine_precision@10 | 0.0808 |
|
745 |
+
| cosine_recall@1 | 0.4081 |
|
746 |
+
| cosine_recall@3 | 0.6312 |
|
747 |
+
| cosine_recall@5 | 0.7177 |
|
748 |
+
| cosine_recall@10 | 0.8077 |
|
749 |
+
| cosine_ndcg@10 | 0.6045 |
|
750 |
+
| cosine_mrr@10 | 0.5399 |
|
751 |
+
| **cosine_map@100** | **0.5472** |
|
752 |
+
|
753 |
+
<!--
|
754 |
+
## Bias, Risks and Limitations
|
755 |
+
|
756 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
757 |
+
-->
|
758 |
+
|
759 |
+
<!--
|
760 |
+
### Recommendations
|
761 |
+
|
762 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
763 |
+
-->
|
764 |
+
|
765 |
+
## Training Details
|
766 |
+
|
767 |
+
### Training Dataset
|
768 |
+
|
769 |
+
#### Unnamed Dataset
|
770 |
+
|
771 |
+
|
772 |
+
* Size: 3,262 training samples
|
773 |
+
* Columns: <code>anchor</code> and <code>positive</code>
|
774 |
+
* Approximate statistics based on the first 1000 samples:
|
775 |
+
| | anchor | positive |
|
776 |
+
|:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
|
777 |
+
| type | string | string |
|
778 |
+
| details | <ul><li>min: 15 tokens</li><li>mean: 29.17 tokens</li><li>max: 53 tokens</li></ul> | <ul><li>min: 308 tokens</li><li>mean: 510.05 tokens</li><li>max: 512 tokens</li></ul> |
|
779 |
+
* Samples:
|
780 |
+
| anchor | positive |
|
781 |
+
|:------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
782 |
+
| <code>Welche Datenbestände decken die Region Rostock und Umgebung ab und enthalten Informationen zu Verkehrswegen und -sicherheit?</code> | <code><br>Datenbestand<br> - titel: Großraum- und Schwertransportrouten<br> - typ: Fachverfahren<br> - kurzbeschreibung: Empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung mit Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind.<br> - allgemeine_beschreibung: Der Datensatz umfasst die empfohlenen Großraum- und Schwertransportwege in der Hanse- und Universitätsstadt Rostock und Umgebung. Er enthält Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind. Die Ressourcen werden regelmäßig alle 365 Tage aktualisiert.<br> - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt. Zuständige Behörden sind das Ministerium für Inneres und Europa Mecklenburg-Vorpommern mit dem Ressort Kommunalaufsicht. Die Daten enthalten wichtige Informationen für die Verkehrsplanung und -sicherheit in Rostock und Umgebung.<br> - zweck: Der Datensatz wird erhoben, um Informationen über empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung bereitzustellen. Er dient der Planung und Durchführung von Großraum- und Schwertransporten sowie der Sicherstellung der Verkehrssicherheit und Infrastrukturintegrität.<br> - einfuehrungsjahr: 2018<br>Datenbestand hat Datenlieferanten<br> - name: Hanse- und Universitätsstadt Rostock<br>Datenbestand hat Schlagwort<br> - name: verkehrsinfrastruktur<br> - name: Erlaubnis<br> - name: Genehmigung<br> - name: straßennetz<br> - name: stadtverkehr<br> - name: infrastruktur<br> - name: brücke<br> - name: Großraum- und Schwertransport<br> - name: straßenverkehrstechnik<br> - name: tunnel<br> - name: verkehr<br> - name: bauwerk<br> - name: Straßenverkehrs-Ordnung<br> - name: öffentlicher-verkehr<br> - name: straße<br> - name: verkehrstechnik<br> - name: straßenverkehr<br> - name: öffentliche-straße<br> - name: Straßenverkehrszulassungsverordnung<br>Datenbestand hat Kategorie<br> - name: Verkehr<br> - name: Regierung und öffentlicher Sektor<br> - name: Regionen und Städte<br>Datenbestand hat politische Ebenen<br> - name: Ebene der Landkreise und Regierungsbezirke<br>Datenbestand hat politisches Gebiet<br> - name: Rostock<br> - name: Hanse- und Universitätsstadt<br>Datenbestand hat Sprache<br> - name: Deutsch<br>Datenbestand hat geografische Abdeckung<br> - name: Rostock und Umgebung<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium des Innern und für Heimat<br> - kurzbezeichnung: BMI<br> - ressorts: Hanse- und Universitätsstadt Rostock<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Hanse- und Universitätsstadt Rostock<br> - kurzbezeichnung: Rostock<br> - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung<br> - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern<br> - ressort: Kommunalaufsicht<br>Datenbestand hat Gesetze:<br>Gesetz<br> - absatz: 3<br> - bezeichnung: Straßenverkehrs-Ordnung (StVO)<br> - kurzbezeichnung: StVO<br> - paragraph: § 29<br>Datenbestand hat Verordnung<br>Verordnung<br> - referenz: https://www.buzer.de/StTbV.htm<br> - bezeichnung: Straßenverkehr-Transportbegleitungsverordnung (StTbV)<br> - kurzbezeichnung: StTbV<br>Verordnung<br> - referenz: https://www.buzer.de/StTbV.htm<br> - bezeichnung: Straßenverkehrs-Zulassungs-Ordnung (StVZO)<br> - kurzbezeichnung: StVZO<br></code> |
|
783 |
+
| <code>Welche Datenbestände bieten Einblicke in die Standorte und Strukturen des THW für Koordinationszwecke im Katastrophenschutz?</code> | <code><br>Datenbestand<br> - titel: Übersicht der THW-Liegenschaften<br> - typ: Fachverfahren<br> - kurzbeschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Adressen und Geoinformationen zu den Standorten des Technischen Hilfswerks (THW) in Deutschland.<br> - allgemeine_beschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Informationen über die verschiedenen Standorte des Technischen Hilfswerks (THW) in Deutschland. Dazu gehören 668 Ortsverbände, 66 Geschäftsstellen, acht Landesverbände, eine Bundesschule mit zwei Standorten und die THW-Leitung. Die Daten enthalten Adressen und Geoinformationen zu den THW-Liegenschaften.<br> - fachliche_beschreibung: Der Datensatz wird von der Bundesanstalt Technisches Hilfswerk erhoben und bereitgestellt. Das THW ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt und hat als Aufgaben den Katastrophenschutz, technisch-humanitäre Hilfeleistungen und die Organisation von Einsatzkräften. Die Daten werden vom Referat Z2 - Organisation des THW geliefert und sind über das GovData Portal verfügbar.<br> - zweck: Der Datensatz wird erhoben, um einen umfassenden Überblick über die Standorte und Strukturen des Technischen Hilfswerks in Deutschland zu bieten. Er dient der Transparenz und kann für Planungs- und Koordinationszwecke im Bereich des Katastrophenschutzes und der technisch-humanitären Hilfeleistungen genutzt werden.<br> - einfuehrungsjahr: 2015<br> - zeitliche_abdeckung_start: 2015-01-01T00:00:00<br>Datenbestand hat Datenlieferanten<br> - name: Referat Z2 - Organisation<br> - name: Bundesanstalt Technisches Hilfswerk<br>Datenbestand hat Schlagwort<br> - name: THW-Landesverband<br> - name: THW-Ortsverband<br> - name: Rettung<br> - name: Katastrophenschutz<br> - name: Bergung<br> - name: THW-Leitung<br> - name: THW-Dienststellen<br> - name: technisch-humanitäre Hilfeleistungen<br> - name: THW-Liegenschaft<br> - name: Geoinformationen<br> - name: THW<br> - name: THW-Geschäftsstelle<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium des Innern und für Heimat<br> - kurzbezeichnung: BMI<br> - ressorts: Bundesanstalt Technisches Hilfswerk, Referat Z2 - Organisation<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Bundesanstalt Technisches Hilfswerk<br> - kurzbezeichnung: THW<br> - themen: Katastrophenschutz, technisch-humanitäre Hilfeleistungen, Organisation von Einsatzkräften<br> - ministerium_des_geschaeftsbereichs: Bundesministerium des Innern, für Bau und Heimat<br> - ressort: Geschäftsbereich des Bundesministeriums des Innern, für Bau und Heimat<br>Datenbestand hat Gesetze:<br>Gesetz<br> - absatz: 1<br> - bezeichnung: Gesetz über das Technische Hilfswerk (THW-Gesetz)<br> - kurzbezeichnung: THWG<br> - paragraph: § 4<br>Datenbestand hat Verordnung<br>Verordnung<br> - referenz: https://beck-online.beck.de/Normen/29337/T?pagenr=21&sortField=1&sortDirection=1<br> - bezeichnung: Technisches Hilfswerk-Auslandsunfallfürsorgeverordnung<br> - kurzbezeichnung: THW-AuslUFV<br>Verordnung<br> - referenz: https://ov-ludwigsburg.thw.de/fileadmin/user_upload/LVBW/GSTU/OLUD/Mediathek/Dokumente/thw_go_ea_anlage_00.pdf<br> - bezeichnung: Geschäftsordnung des Technischen Hilfswerks<br> - kurzbezeichnung: THW-GO<br></code> |
|
784 |
+
| <code>Welche Datensätze analysieren die Geschlechterverteilung von Schulabgängern ohne Abschluss in deutschen Kreisen von 2006 bis 2021?</code> | <code><br>Datenbestand<br> - titel: Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen<br> - typ: Fachverfahren<br> - kurzbeschreibung: Prozentualer Anteil von Frauen und Männern an Schulabgängern ohne Hauptschulabschluss nach Kreisen<br> - allgemeine_beschreibung: Der Datensatz enthält den prozentualen Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen in Deutschland.<br> - fachliche_beschreibung: Der Datensatz wird vom Bundesministerium für Familie, Senioren, Frauen und Jugend bereitgestellt und enthält Informationen über den Anteil von Frauen und Männern an Schulabgängern ohne ersten Schulabschluss aus allgemeinbildenden Schulen in Deutschland. Die Daten werden nach Kreisen aufgeschlüsselt und dienen der Analyse der Bildungssituation in verschiedenen Regionen des Landes.<br> - zweck: Der Datensatz wird erhoben, um die Geschlechterverteilung bei Schulabgängern ohne Hauptschulabschluss in verschiedenen Regionen Deutschlands zu analysieren und mögliche Maßnahmen zur Verbesserung der Bildungschancen zu entwickeln.<br> - einfuehrungsjahr: 2023<br> - zeitliche_abdeckung_start: 2006-01-01<br> - zeitliche_abdeckung_ende: 2021-12-31<br>Datenbestand hat Datenlieferanten<br> - name: Bundesministerium für Familie<br> - name: Frauen und Jugend<br> - name: Senioren<br>Datenbestand hat Schlagwort<br> - name: bildung<br> - name: schulabbrecher<br> - name: gleichstellung<br> - name: schulabschluss<br> - name: schule<br>Datenbestand hat Kategorie<br> - name: Bevölkerung und Gesellschaft<br>Datenbestand hat politische Ebenen<br> - name: Ebene der Landkreise und Regierungsbezirke<br>Datenbestand hat Sprache<br> - name: Deutsch<br>Datenbestand hat geografische Abdeckung<br> - name: Bundesrepublik Deutschland<br> - name: aufgeschlüsselt nach Kreisen<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - kurzbezeichnung: BMFSFJ<br> - ressorts: Familie, Senioren, Frauen, Jugend<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - kurzbezeichnung: BMFSFJ<br> - ministerium_des_geschaeftsbereichs: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - ressort: Bundesministerium für Familie, Senioren, Frauen und Jugend<br>Datenbestand hat Gesetze:<br>Gesetz<br> - bezeichnung: E-Government-Gesetz<br>Datenbestand hat Verordnung<br>Verordnung<br>Verordnung<br> - referenz: https://recht.nrw.de/lmi/owa/br_vbl_detail_text?anw_nr=6&vd_id=20346&vd_back=N405&sg=0&menu=0<br> - bezeichnung: § 50 Schulgesetz NRW<br></code> |
|
785 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
786 |
+
```json
|
787 |
+
{
|
788 |
+
"loss": "MultipleNegativesRankingLoss",
|
789 |
+
"matryoshka_dims": [
|
790 |
+
512
|
791 |
+
],
|
792 |
+
"matryoshka_weights": [
|
793 |
+
1
|
794 |
+
],
|
795 |
+
"n_dims_per_step": -1
|
796 |
+
}
|
797 |
+
```
|
798 |
+
|
799 |
+
### Training Hyperparameters
|
800 |
+
#### Non-Default Hyperparameters
|
801 |
+
|
802 |
+
- `eval_strategy`: epoch
|
803 |
+
- `learning_rate`: 1e-05
|
804 |
+
- `warmup_ratio`: 0.1
|
805 |
+
- `bf16`: True
|
806 |
+
- `tf32`: False
|
807 |
+
- `load_best_model_at_end`: True
|
808 |
+
|
809 |
+
#### All Hyperparameters
|
810 |
+
<details><summary>Click to expand</summary>
|
811 |
+
|
812 |
+
- `overwrite_output_dir`: False
|
813 |
+
- `do_predict`: False
|
814 |
+
- `eval_strategy`: epoch
|
815 |
+
- `prediction_loss_only`: True
|
816 |
+
- `per_device_train_batch_size`: 8
|
817 |
+
- `per_device_eval_batch_size`: 8
|
818 |
+
- `per_gpu_train_batch_size`: None
|
819 |
+
- `per_gpu_eval_batch_size`: None
|
820 |
+
- `gradient_accumulation_steps`: 1
|
821 |
+
- `eval_accumulation_steps`: None
|
822 |
+
- `torch_empty_cache_steps`: None
|
823 |
+
- `learning_rate`: 1e-05
|
824 |
+
- `weight_decay`: 0.0
|
825 |
+
- `adam_beta1`: 0.9
|
826 |
+
- `adam_beta2`: 0.999
|
827 |
+
- `adam_epsilon`: 1e-08
|
828 |
+
- `max_grad_norm`: 1.0
|
829 |
+
- `num_train_epochs`: 3
|
830 |
+
- `max_steps`: -1
|
831 |
+
- `lr_scheduler_type`: linear
|
832 |
+
- `lr_scheduler_kwargs`: {}
|
833 |
+
- `warmup_ratio`: 0.1
|
834 |
+
- `warmup_steps`: 0
|
835 |
+
- `log_level`: passive
|
836 |
+
- `log_level_replica`: warning
|
837 |
+
- `log_on_each_node`: True
|
838 |
+
- `logging_nan_inf_filter`: True
|
839 |
+
- `save_safetensors`: True
|
840 |
+
- `save_on_each_node`: False
|
841 |
+
- `save_only_model`: False
|
842 |
+
- `restore_callback_states_from_checkpoint`: False
|
843 |
+
- `no_cuda`: False
|
844 |
+
- `use_cpu`: False
|
845 |
+
- `use_mps_device`: False
|
846 |
+
- `seed`: 42
|
847 |
+
- `data_seed`: None
|
848 |
+
- `jit_mode_eval`: False
|
849 |
+
- `use_ipex`: False
|
850 |
+
- `bf16`: True
|
851 |
+
- `fp16`: False
|
852 |
+
- `fp16_opt_level`: O1
|
853 |
+
- `half_precision_backend`: auto
|
854 |
+
- `bf16_full_eval`: False
|
855 |
+
- `fp16_full_eval`: False
|
856 |
+
- `tf32`: False
|
857 |
+
- `local_rank`: 0
|
858 |
+
- `ddp_backend`: None
|
859 |
+
- `tpu_num_cores`: None
|
860 |
+
- `tpu_metrics_debug`: False
|
861 |
+
- `debug`: []
|
862 |
+
- `dataloader_drop_last`: False
|
863 |
+
- `dataloader_num_workers`: 0
|
864 |
+
- `dataloader_prefetch_factor`: None
|
865 |
+
- `past_index`: -1
|
866 |
+
- `disable_tqdm`: False
|
867 |
+
- `remove_unused_columns`: True
|
868 |
+
- `label_names`: None
|
869 |
+
- `load_best_model_at_end`: True
|
870 |
+
- `ignore_data_skip`: False
|
871 |
+
- `fsdp`: []
|
872 |
+
- `fsdp_min_num_params`: 0
|
873 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
874 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
875 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
876 |
+
- `deepspeed`: None
|
877 |
+
- `label_smoothing_factor`: 0.0
|
878 |
+
- `optim`: adamw_torch
|
879 |
+
- `optim_args`: None
|
880 |
+
- `adafactor`: False
|
881 |
+
- `group_by_length`: False
|
882 |
+
- `length_column_name`: length
|
883 |
+
- `ddp_find_unused_parameters`: None
|
884 |
+
- `ddp_bucket_cap_mb`: None
|
885 |
+
- `ddp_broadcast_buffers`: False
|
886 |
+
- `dataloader_pin_memory`: True
|
887 |
+
- `dataloader_persistent_workers`: False
|
888 |
+
- `skip_memory_metrics`: True
|
889 |
+
- `use_legacy_prediction_loop`: False
|
890 |
+
- `push_to_hub`: False
|
891 |
+
- `resume_from_checkpoint`: None
|
892 |
+
- `hub_model_id`: None
|
893 |
+
- `hub_strategy`: every_save
|
894 |
+
- `hub_private_repo`: False
|
895 |
+
- `hub_always_push`: False
|
896 |
+
- `gradient_checkpointing`: False
|
897 |
+
- `gradient_checkpointing_kwargs`: None
|
898 |
+
- `include_inputs_for_metrics`: False
|
899 |
+
- `eval_do_concat_batches`: True
|
900 |
+
- `fp16_backend`: auto
|
901 |
+
- `push_to_hub_model_id`: None
|
902 |
+
- `push_to_hub_organization`: None
|
903 |
+
- `mp_parameters`:
|
904 |
+
- `auto_find_batch_size`: False
|
905 |
+
- `full_determinism`: False
|
906 |
+
- `torchdynamo`: None
|
907 |
+
- `ray_scope`: last
|
908 |
+
- `ddp_timeout`: 1800
|
909 |
+
- `torch_compile`: False
|
910 |
+
- `torch_compile_backend`: None
|
911 |
+
- `torch_compile_mode`: None
|
912 |
+
- `dispatch_batches`: None
|
913 |
+
- `split_batches`: None
|
914 |
+
- `include_tokens_per_second`: False
|
915 |
+
- `include_num_input_tokens_seen`: False
|
916 |
+
- `neftune_noise_alpha`: None
|
917 |
+
- `optim_target_modules`: None
|
918 |
+
- `batch_eval_metrics`: False
|
919 |
+
- `eval_on_start`: False
|
920 |
+
- `use_liger_kernel`: False
|
921 |
+
- `eval_use_gather_object`: False
|
922 |
+
- `batch_sampler`: batch_sampler
|
923 |
+
- `multi_dataset_batch_sampler`: proportional
|
924 |
+
|
925 |
+
</details>
|
926 |
+
|
927 |
+
### Training Logs
|
928 |
+
| Epoch | Step | Training Loss | dim_512_cosine_map@100 |
|
929 |
+
|:-------:|:-------:|:-------------:|:----------------------:|
|
930 |
+
| 0 | 0 | - | 0.5212 |
|
931 |
+
| 0.0490 | 10 | 1.2397 | - |
|
932 |
+
| 0.0980 | 20 | 0.7542 | - |
|
933 |
+
| 0.1471 | 30 | 0.3055 | - |
|
934 |
+
| 0.1961 | 40 | 0.2075 | - |
|
935 |
+
| 0.2451 | 50 | 0.2064 | - |
|
936 |
+
| 0.2941 | 60 | 0.1429 | - |
|
937 |
+
| 0.3431 | 70 | 0.1821 | - |
|
938 |
+
| 0.3922 | 80 | 0.063 | - |
|
939 |
+
| 0.4412 | 90 | 0.078 | - |
|
940 |
+
| 0.4902 | 100 | 0.1026 | - |
|
941 |
+
| 0.5392 | 110 | 0.0717 | - |
|
942 |
+
| 0.5882 | 120 | 0.0394 | - |
|
943 |
+
| 0.6373 | 130 | 0.0751 | - |
|
944 |
+
| 0.6863 | 140 | 0.1377 | - |
|
945 |
+
| 0.7353 | 150 | 0.0666 | - |
|
946 |
+
| 0.7843 | 160 | 0.127 | - |
|
947 |
+
| 0.8333 | 170 | 0.1129 | - |
|
948 |
+
| 0.8824 | 180 | 0.0734 | - |
|
949 |
+
| 0.9314 | 190 | 0.0727 | - |
|
950 |
+
| 0.9804 | 200 | 0.1564 | - |
|
951 |
+
| 1.0 | 204 | - | 0.5428 |
|
952 |
+
| 1.0294 | 210 | 0.0904 | - |
|
953 |
+
| 1.0784 | 220 | 0.0974 | - |
|
954 |
+
| 1.1275 | 230 | 0.0785 | - |
|
955 |
+
| 1.1765 | 240 | 0.0704 | - |
|
956 |
+
| 1.2255 | 250 | 0.0929 | - |
|
957 |
+
| 1.2745 | 260 | 0.1119 | - |
|
958 |
+
| 1.3235 | 270 | 0.0459 | - |
|
959 |
+
| 1.3725 | 280 | 0.1181 | - |
|
960 |
+
| 1.4216 | 290 | 0.0459 | - |
|
961 |
+
| 1.4706 | 300 | 0.0248 | - |
|
962 |
+
| 1.5196 | 310 | 0.0567 | - |
|
963 |
+
| 1.5686 | 320 | 0.0247 | - |
|
964 |
+
| 1.6176 | 330 | 0.0412 | - |
|
965 |
+
| 1.6667 | 340 | 0.0498 | - |
|
966 |
+
| 1.7157 | 350 | 0.0693 | - |
|
967 |
+
| 1.7647 | 360 | 0.0589 | - |
|
968 |
+
| 1.8137 | 370 | 0.0383 | - |
|
969 |
+
| 1.8627 | 380 | 0.0429 | - |
|
970 |
+
| 1.9118 | 390 | 0.0466 | - |
|
971 |
+
| 1.9608 | 400 | 0.0331 | - |
|
972 |
+
| **2.0** | **408** | **-** | **0.5469** |
|
973 |
+
| 2.0098 | 410 | 0.0812 | - |
|
974 |
+
| 2.0588 | 420 | 0.0705 | - |
|
975 |
+
| 2.1078 | 430 | 0.0215 | - |
|
976 |
+
| 2.1569 | 440 | 0.0571 | - |
|
977 |
+
| 2.2059 | 450 | 0.0821 | - |
|
978 |
+
| 2.2549 | 460 | 0.046 | - |
|
979 |
+
| 2.3039 | 470 | 0.0165 | - |
|
980 |
+
| 2.3529 | 480 | 0.0335 | - |
|
981 |
+
| 2.4020 | 490 | 0.0339 | - |
|
982 |
+
| 2.4510 | 500 | 0.0291 | - |
|
983 |
+
| 2.5 | 510 | 0.0788 | - |
|
984 |
+
| 2.5490 | 520 | 0.0468 | - |
|
985 |
+
| 2.5980 | 530 | 0.0457 | - |
|
986 |
+
| 2.6471 | 540 | 0.0121 | - |
|
987 |
+
| 2.6961 | 550 | 0.0543 | - |
|
988 |
+
| 2.7451 | 560 | 0.0463 | - |
|
989 |
+
| 2.7941 | 570 | 0.0974 | - |
|
990 |
+
| 2.8431 | 580 | 0.0204 | - |
|
991 |
+
| 2.8922 | 590 | 0.012 | - |
|
992 |
+
| 2.9412 | 600 | 0.0545 | - |
|
993 |
+
| 2.9902 | 610 | 0.0581 | - |
|
994 |
+
| 3.0 | 612 | - | 0.5472 |
|
995 |
+
|
996 |
+
* The bold row denotes the saved checkpoint.
|
997 |
+
|
998 |
+
### Framework Versions
|
999 |
+
- Python: 3.10.12
|
1000 |
+
- Sentence Transformers: 3.1.1
|
1001 |
+
- Transformers: 4.45.2
|
1002 |
+
- PyTorch: 2.4.1+cu121
|
1003 |
+
- Accelerate: 1.0.0
|
1004 |
+
- Datasets: 3.0.1
|
1005 |
+
- Tokenizers: 0.20.1
|
1006 |
+
|
1007 |
+
## Citation
|
1008 |
+
|
1009 |
+
### BibTeX
|
1010 |
+
|
1011 |
+
#### Sentence Transformers
|
1012 |
+
```bibtex
|
1013 |
+
@inproceedings{reimers-2019-sentence-bert,
|
1014 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
1015 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
1016 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
1017 |
+
month = "11",
|
1018 |
+
year = "2019",
|
1019 |
+
publisher = "Association for Computational Linguistics",
|
1020 |
+
url = "https://arxiv.org/abs/1908.10084",
|
1021 |
+
}
|
1022 |
+
```
|
1023 |
+
|
1024 |
+
#### MatryoshkaLoss
|
1025 |
+
```bibtex
|
1026 |
+
@misc{kusupati2024matryoshka,
|
1027 |
+
title={Matryoshka Representation Learning},
|
1028 |
+
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
|
1029 |
+
year={2024},
|
1030 |
+
eprint={2205.13147},
|
1031 |
+
archivePrefix={arXiv},
|
1032 |
+
primaryClass={cs.LG}
|
1033 |
+
}
|
1034 |
+
```
|
1035 |
+
|
1036 |
+
#### MultipleNegativesRankingLoss
|
1037 |
+
```bibtex
|
1038 |
+
@misc{henderson2017efficient,
|
1039 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
1040 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
1041 |
+
year={2017},
|
1042 |
+
eprint={1705.00652},
|
1043 |
+
archivePrefix={arXiv},
|
1044 |
+
primaryClass={cs.CL}
|
1045 |
+
}
|
1046 |
+
```
|
1047 |
+
|
1048 |
+
<!--
|
1049 |
+
## Glossary
|
1050 |
+
|
1051 |
+
*Clearly define terms in order to be accessible across audiences.*
|
1052 |
+
-->
|
1053 |
+
|
1054 |
+
<!--
|
1055 |
+
## Model Card Authors
|
1056 |
+
|
1057 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
1058 |
+
-->
|
1059 |
+
|
1060 |
+
<!--
|
1061 |
+
## Model Card Contact
|
1062 |
+
|
1063 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
1064 |
+
-->
|
added_tokens.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"[MXBAI_P]": 178884,
|
3 |
+
"[MXBAI_Q]": 178883
|
4 |
+
}
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "mixedbread-ai/deepset-mxbai-embed-de-large-v1",
|
3 |
+
"architectures": [
|
4 |
+
"XLMRobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 1024,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 4096,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 514,
|
17 |
+
"model_type": "xlm-roberta",
|
18 |
+
"num_attention_heads": 16,
|
19 |
+
"num_hidden_layers": 24,
|
20 |
+
"output_past": true,
|
21 |
+
"pad_token_id": 1,
|
22 |
+
"position_embedding_type": "absolute",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.45.2",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": false,
|
27 |
+
"vocab_size": 178885
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.1.1",
|
4 |
+
"transformers": "4.45.2",
|
5 |
+
"pytorch": "2.4.1+cu121"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": null
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:9aa4e132e9aa5636a2f1321907026ba10176086395ef20c800273d6cf92920cc
|
3 |
+
size 1948311760
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 512,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
sentencepiece.bpe.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
|
3 |
+
size 5069051
|
special_tokens_map.json
ADDED
@@ -0,0 +1,55 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"additional_special_tokens": [
|
3 |
+
"[MXBAI_Q]",
|
4 |
+
"[MXBAI_P]"
|
5 |
+
],
|
6 |
+
"bos_token": {
|
7 |
+
"content": "<s>",
|
8 |
+
"lstrip": false,
|
9 |
+
"normalized": false,
|
10 |
+
"rstrip": false,
|
11 |
+
"single_word": false
|
12 |
+
},
|
13 |
+
"cls_token": {
|
14 |
+
"content": "<s>",
|
15 |
+
"lstrip": false,
|
16 |
+
"normalized": false,
|
17 |
+
"rstrip": false,
|
18 |
+
"single_word": false
|
19 |
+
},
|
20 |
+
"eos_token": {
|
21 |
+
"content": "</s>",
|
22 |
+
"lstrip": false,
|
23 |
+
"normalized": false,
|
24 |
+
"rstrip": false,
|
25 |
+
"single_word": false
|
26 |
+
},
|
27 |
+
"mask_token": {
|
28 |
+
"content": "<mask>",
|
29 |
+
"lstrip": true,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false
|
33 |
+
},
|
34 |
+
"pad_token": {
|
35 |
+
"content": "<pad>",
|
36 |
+
"lstrip": false,
|
37 |
+
"normalized": false,
|
38 |
+
"rstrip": false,
|
39 |
+
"single_word": false
|
40 |
+
},
|
41 |
+
"sep_token": {
|
42 |
+
"content": "</s>",
|
43 |
+
"lstrip": false,
|
44 |
+
"normalized": false,
|
45 |
+
"rstrip": false,
|
46 |
+
"single_word": false
|
47 |
+
},
|
48 |
+
"unk_token": {
|
49 |
+
"content": "<unk>",
|
50 |
+
"lstrip": false,
|
51 |
+
"normalized": false,
|
52 |
+
"rstrip": false,
|
53 |
+
"single_word": false
|
54 |
+
}
|
55 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:b319c37e4f1e5f8f1c8dba7e1bc7b1a424184365d7f982ada0f18ab60c514c07
|
3 |
+
size 12283980
|
tokenizer_config.json
ADDED
@@ -0,0 +1,74 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"178882": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
},
|
43 |
+
"178883": {
|
44 |
+
"content": "[MXBAI_Q]",
|
45 |
+
"lstrip": false,
|
46 |
+
"normalized": false,
|
47 |
+
"rstrip": false,
|
48 |
+
"single_word": false,
|
49 |
+
"special": true
|
50 |
+
},
|
51 |
+
"178884": {
|
52 |
+
"content": "[MXBAI_P]",
|
53 |
+
"lstrip": false,
|
54 |
+
"normalized": false,
|
55 |
+
"rstrip": false,
|
56 |
+
"single_word": false,
|
57 |
+
"special": true
|
58 |
+
}
|
59 |
+
},
|
60 |
+
"additional_special_tokens": [
|
61 |
+
"[MXBAI_Q]",
|
62 |
+
"[MXBAI_P]"
|
63 |
+
],
|
64 |
+
"bos_token": "<s>",
|
65 |
+
"clean_up_tokenization_spaces": true,
|
66 |
+
"cls_token": "<s>",
|
67 |
+
"eos_token": "</s>",
|
68 |
+
"mask_token": "<mask>",
|
69 |
+
"model_max_length": 512,
|
70 |
+
"pad_token": "<pad>",
|
71 |
+
"sep_token": "</s>",
|
72 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
73 |
+
"unk_token": "<unk>"
|
74 |
+
}
|
training_args.bin
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:ba9d6452883002399e6e0c6117f9bd3fb5fe792180fc8266e9746fdef221a75f
|
3 |
+
size 5624
|