Spaces:

lilacai
/

lilac

Running

App Files Files Community

nsthorat commited on Aug 8, 2023

Commit

8640ad4

•

1 Parent(s): b027cda

Push

Browse files

Files changed (37) hide show

.gitattributes +0 -18
README.md +1 -1
data/datasets/local/imdb/data-00000-of-00001.parquet +0 -3
data/datasets/local/imdb/manifest.json +0 -21
data/datasets/local/imdb/settings.json +0 -1
data/datasets/local/imdb/text/gte-small/hnsw.hnswlib.bin +0 -3
data/datasets/local/imdb/text/gte-small/hnsw.lookup.pkl +0 -3
data/datasets/local/imdb/text/gte-small/signal_manifest.json +0 -35
data/datasets/local/imdb/text/gte-small/spans.pkl +0 -3
data/datasets/local/imdb/text/lang_detection(split_by_paragraph=True)/data-00000-of-00001.parquet +0 -3
data/datasets/local/imdb/text/lang_detection(split_by_paragraph=True)/signal_manifest.json +0 -38
data/datasets/local/imdb/text/near_dup/data-00000-of-00001.parquet +0 -3
data/datasets/local/imdb/text/near_dup/signal_manifest.json +0 -36
data/datasets/local/imdb/text/pii/data-00000-of-00001.parquet +0 -3
data/datasets/local/imdb/text/pii/signal_manifest.json +0 -45
data/datasets/local/imdb/text/spacy_ner/data-00000-of-00001.parquet +0 -3
data/datasets/local/imdb/text/spacy_ner/signal_manifest.json +0 -38
data/datasets/local/imdb/text/text_statistics/data-00000-of-00001.parquet +0 -3
data/datasets/local/imdb/text/text_statistics/signal_manifest.json +0 -59
data/datasets/local/open-asssistant-conversations/data-00000-of-00001.parquet +0 -3
data/datasets/local/open-asssistant-conversations/manifest.json +0 -118
data/datasets/local/open-asssistant-conversations/settings.json +0 -1
data/datasets/local/open-asssistant-conversations/text/gte-small/hnsw.hnswlib.bin +0 -3
data/datasets/local/open-asssistant-conversations/text/gte-small/hnsw.lookup.pkl +0 -3
data/datasets/local/open-asssistant-conversations/text/gte-small/signal_manifest.json +0 -35
data/datasets/local/open-asssistant-conversations/text/gte-small/spans.pkl +0 -3
data/datasets/local/open-asssistant-conversations/text/lang_detection(split_by_paragraph=True)/data-00000-of-00001.parquet +0 -3
data/datasets/local/open-asssistant-conversations/text/lang_detection(split_by_paragraph=True)/signal_manifest.json +0 -38
data/datasets/local/open-asssistant-conversations/text/near_dup/data-00000-of-00001.parquet +0 -3
data/datasets/local/open-asssistant-conversations/text/near_dup/signal_manifest.json +0 -36
data/datasets/local/open-asssistant-conversations/text/pii/data-00000-of-00001.parquet +0 -3
data/datasets/local/open-asssistant-conversations/text/pii/signal_manifest.json +0 -45
data/datasets/local/open-asssistant-conversations/text/spacy_ner/data-00000-of-00001.parquet +0 -3
data/datasets/local/open-asssistant-conversations/text/spacy_ner/signal_manifest.json +0 -38
data/datasets/local/open-asssistant-conversations/text/text_statistics/data-00000-of-00001.parquet +0 -3
data/datasets/local/open-asssistant-conversations/text/text_statistics/signal_manifest.json +0 -59
lilac/concepts/db_concept.py +1 -0

.gitattributes DELETED Viewed

@@ -1,18 +0,0 @@
-data/datasets/local/open-asssistant-conversations/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/gte-small/hnsw.hnswlib.bin filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/gte-small/hnsw.lookup.pkl filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/gte-small/spans.pkl filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/lang_detection(split_by_paragraph=True)/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/near_dup/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/pii/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/spacy_ner/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/open-asssistant-conversations/text/text_statistics/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/gte-small/hnsw.hnswlib.bin filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/gte-small/hnsw.lookup.pkl filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/gte-small/spans.pkl filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/lang_detection(split_by_paragraph=True)/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/near_dup/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/pii/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/spacy_ner/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text
-data/datasets/local/imdb/text/text_statistics/data-00000-of-00001.parquet filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,5 +1,5 @@
 ---
-title: Lilac Blueprint
 emoji: 🌷
 colorFrom: purple
 colorTo: purple

 ---
+title: Lilac
 emoji: 🌷
 colorFrom: purple
 colorTo: purple

data/datasets/local/imdb/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:5cf3f121bae8b8d8c12af8bebe4cda35c2a84750470fff57ea37a4930c257d6f
-size 86160733

data/datasets/local/imdb/manifest.json DELETED Viewed

@@ -1,21 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "data_schema": {
- "fields": {
- "text": {
- "dtype": "string"
- },
- "label": {
- "dtype": "string"
- },
- "__hfsplit__": {
- "dtype": "string"
- },
- "__rowid__": {
- "dtype": "string"
- }
- }
- }
-}

data/datasets/local/imdb/settings.json DELETED Viewed

	@@ -1 +0,0 @@
1	- {"ui": {"media_paths": [["text"]], "markdown_paths": []}, "preferred_embedding": "gte-small"}

data/datasets/local/imdb/text/gte-small/hnsw.hnswlib.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:4659a623093a2ef1646885a6ecb6ef86c56c2dcd0b10900d7b46d193dfb69e7f
-size 691432464

data/datasets/local/imdb/text/gte-small/hnsw.lookup.pkl DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:7cbf4a5777b0cd1f8bb5061a6177b27cc0f5a8a6349c487c0c5c52fe60697d64
-size 10390846

data/datasets/local/imdb/text/gte-small/signal_manifest.json DELETED Viewed

@@ -1,35 +0,0 @@
-{
- "files": [],
- "parquet_id": "gte-small(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "gte-small": {
- "repeated_field": {
- "fields": {
- "embedding": {
- "dtype": "embedding"
- }
- },
- "dtype": "string_span"
- },
- "signal": {
- "signal_name": "gte-small"
- }
- }
- }
- }
- }
- },
- "signal": {
- "signal_name": "gte-small"
- },
- "enriched_path": [
- "text"
- ],
- "vector_store": "hnsw"
-}

data/datasets/local/imdb/text/gte-small/spans.pkl DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:526e8505beb2386e3ff30367968685fd2229f76af2c0c86d50afaa7da3018dbc
-size 7476546

data/datasets/local/imdb/text/lang_detection(split_by_paragraph=True)/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:3dd9ee881d6bf4fa2bb3a6db647d0c6d1f648b4a80b4e6d1aa081032bfddf5bc
-size 3495763

data/datasets/local/imdb/text/lang_detection(split_by_paragraph=True)/signal_manifest.json DELETED Viewed

@@ -1,38 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "lang_detection(split_by_paragraph=True)(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "lang_detection(split_by_paragraph=True)": {
- "repeated_field": {
- "fields": {
- "lang_code": {
- "dtype": "string"
- }
- },
- "dtype": "string_span"
- },
- "signal": {
- "split_by_paragraph": true,
- "signal_name": "lang_detection"
- }
- }
- }
- }
- }
- },
- "signal": {
- "split_by_paragraph": true,
- "signal_name": "lang_detection"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/imdb/text/near_dup/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a1ccd12fc66d0c31a19554fcb5f442751807745e51c3a9336cec637525a422fc
-size 3916036

data/datasets/local/imdb/text/near_dup/signal_manifest.json DELETED Viewed

@@ -1,36 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "near_dup(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "near_dup": {
- "fields": {
- "cluster_id": {
- "dtype": "uint32",
- "categorical": true
- }
- },
- "signal": {
- "threshold": 0.75,
- "signal_name": "near_dup"
- }
- }
- }
- }
- }
- },
- "signal": {
- "threshold": 0.75,
- "signal_name": "near_dup"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/imdb/text/pii/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:b4f1f559281ca4e3efcafd4b10c51cbe2f5039d86ce95d3dc07156671fd8b824
-size 3313984

data/datasets/local/imdb/text/pii/signal_manifest.json DELETED Viewed

@@ -1,45 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "pii(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "pii": {
- "fields": {
- "emails": {
- "repeated_field": {
- "dtype": "string_span"
- }
- },
- "ip_addresses": {
- "repeated_field": {
- "dtype": "string_span"
- }
- },
- "secrets": {
- "repeated_field": {
- "dtype": "string_span"
- }
- }
- },
- "signal": {
- "signal_name": "pii"
- }
- }
- }
- }
- }
- },
- "signal": {
- "signal_name": "pii"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/imdb/text/spacy_ner/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:19ce0e0966a4db29b7b862aa3fa87ef3b02997e57efcdd722023819caa1be7bb
-size 8483750

data/datasets/local/imdb/text/spacy_ner/signal_manifest.json DELETED Viewed

@@ -1,38 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "spacy_ner(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "spacy_ner": {
- "repeated_field": {
- "fields": {
- "label": {
- "dtype": "string"
- }
- },
- "dtype": "string_span"
- },
- "signal": {
- "model": "en_core_web_sm",
- "signal_name": "spacy_ner"
- }
- }
- }
- }
- }
- },
- "signal": {
- "model": "en_core_web_sm",
- "signal_name": "spacy_ner"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/imdb/text/text_statistics/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:672357a255fecf4e29604674ff3ceb11b6772d0388293f5267f608a6163faf49
-size 4404092

data/datasets/local/imdb/text/text_statistics/signal_manifest.json DELETED Viewed

@@ -1,59 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "text_statistics(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "text_statistics": {
- "fields": {
- "num_characters": {
- "dtype": "int32"
- },
- "readability": {
- "dtype": "float32"
- },
- "log(type_token_ratio)": {
- "dtype": "float32"
- },
- "frac_non_ascii": {
- "dtype": "float32",
- "bins": [
- [
- "Low",
- null,
- 0.15
- ],
- [
- "Medium",
- 0.15,
- 0.3
- ],
- [
- "High",
- 0.3,
- null
- ]
- ]
- }
- },
- "signal": {
- "signal_name": "text_statistics"
- }
- }
- }
- }
- }
- },
- "signal": {
- "signal_name": "text_statistics"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/open-asssistant-conversations/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:2557dc647ff10b0396e9b40f24468f599661c664ff777c62647605503dea94dc
-size 42071787

data/datasets/local/open-asssistant-conversations/manifest.json DELETED Viewed

@@ -1,118 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "data_schema": {
- "fields": {
- "message_id": {
- "dtype": "string"
- },
- "parent_id": {
- "dtype": "string"
- },
- "user_id": {
- "dtype": "string"
- },
- "created_date": {
- "dtype": "string"
- },
- "text": {
- "dtype": "string"
- },
- "role": {
- "dtype": "string"
- },
- "lang": {
- "dtype": "string"
- },
- "review_count": {
- "dtype": "int32"
- },
- "review_result": {
- "dtype": "boolean"
- },
- "deleted": {
- "dtype": "boolean"
- },
- "rank": {
- "dtype": "int32"
- },
- "synthetic": {
- "dtype": "boolean"
- },
- "model_name": {
- "dtype": "string"
- },
- "detoxify": {
- "fields": {
- "toxicity": {
- "dtype": "float64"
- },
- "severe_toxicity": {
- "dtype": "float64"
- },
- "obscene": {
- "dtype": "float64"
- },
- "identity_attack": {
- "dtype": "float64"
- },
- "insult": {
- "dtype": "float64"
- },
- "threat": {
- "dtype": "float64"
- },
- "sexual_explicit": {
- "dtype": "float64"
- }
- }
- },
- "message_tree_id": {
- "dtype": "string"
- },
- "tree_state": {
- "dtype": "string"
- },
- "emojis": {
- "fields": {
- "name": {
- "repeated_field": {
- "dtype": "string"
- }
- },
- "count": {
- "repeated_field": {
- "dtype": "int32"
- }
- }
- }
- },
- "labels": {
- "fields": {
- "name": {
- "repeated_field": {
- "dtype": "string"
- }
- },
- "value": {
- "repeated_field": {
- "dtype": "float64"
- }
- },
- "count": {
- "repeated_field": {
- "dtype": "int32"
- }
- }
- }
- },
- "__hfsplit__": {
- "dtype": "string"
- },
- "__rowid__": {
- "dtype": "string"
- }
- }
- }
-}

data/datasets/local/open-asssistant-conversations/settings.json DELETED Viewed

	@@ -1 +0,0 @@
1	- {"ui": {"media_paths": [["text"]], "markdown_paths": []}, "preferred_embedding": "gte-small"}

data/datasets/local/open-asssistant-conversations/text/gte-small/hnsw.hnswlib.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:1ef42015e1cfa76fc929c0a8913911c765e871586af7eac6f42def6abbd856f5
-size 327991004

data/datasets/local/open-asssistant-conversations/text/gte-small/hnsw.lookup.pkl DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:4370d3885f9dea3df44fc7e366069c83c93af3b068ed5a56eaa2ac442c4f502c
-size 6171229

data/datasets/local/open-asssistant-conversations/text/gte-small/signal_manifest.json DELETED Viewed

@@ -1,35 +0,0 @@
-{
- "files": [],
- "parquet_id": "gte-small(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "gte-small": {
- "repeated_field": {
- "fields": {
- "embedding": {
- "dtype": "embedding"
- }
- },
- "dtype": "string_span"
- },
- "signal": {
- "signal_name": "gte-small"
- }
- }
- }
- }
- }
- },
- "signal": {
- "signal_name": "gte-small"
- },
- "enriched_path": [
- "text"
- ],
- "vector_store": "hnsw"
-}

data/datasets/local/open-asssistant-conversations/text/gte-small/spans.pkl DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e9b6962f47eefe550b314cdb4d6c6eb0811670f5f41d137b952fcc55e1d331cc
-size 5164058

data/datasets/local/open-asssistant-conversations/text/lang_detection(split_by_paragraph=True)/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:17cf7d5bd4e5b74dbe3024da1e4115c013b65626901916a0aa471e79ba88d1b1
-size 3765373

data/datasets/local/open-asssistant-conversations/text/lang_detection(split_by_paragraph=True)/signal_manifest.json DELETED Viewed

@@ -1,38 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "lang_detection(split_by_paragraph=True)(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "lang_detection(split_by_paragraph=True)": {
- "repeated_field": {
- "fields": {
- "lang_code": {
- "dtype": "string"
- }
- },
- "dtype": "string_span"
- },
- "signal": {
- "split_by_paragraph": true,
- "signal_name": "lang_detection"
- }
- }
- }
- }
- }
- },
- "signal": {
- "split_by_paragraph": true,
- "signal_name": "lang_detection"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/open-asssistant-conversations/text/near_dup/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:43c99611fc94cdd4998e03f18f651fe2ea7b515a5780bbcb78baa2030a3b39b1
-size 3485154

data/datasets/local/open-asssistant-conversations/text/near_dup/signal_manifest.json DELETED Viewed

@@ -1,36 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "near_dup(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "near_dup": {
- "fields": {
- "cluster_id": {
- "dtype": "uint32",
- "categorical": true
- }
- },
- "signal": {
- "threshold": 0.75,
- "signal_name": "near_dup"
- }
- }
- }
- }
- }
- },
- "signal": {
- "threshold": 0.75,
- "signal_name": "near_dup"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/open-asssistant-conversations/text/pii/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:1cc6966d1c3c262121fa6130ff54e4ba7431d89ae81dfbc9ef9025f31bf095be
-size 2953280

data/datasets/local/open-asssistant-conversations/text/pii/signal_manifest.json DELETED Viewed

@@ -1,45 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "pii(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "pii": {
- "fields": {
- "emails": {
- "repeated_field": {
- "dtype": "string_span"
- }
- },
- "ip_addresses": {
- "repeated_field": {
- "dtype": "string_span"
- }
- },
- "secrets": {
- "repeated_field": {
- "dtype": "string_span"
- }
- }
- },
- "signal": {
- "signal_name": "pii"
- }
- }
- }
- }
- }
- },
- "signal": {
- "signal_name": "pii"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/open-asssistant-conversations/text/spacy_ner/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:971edbdc4bdfad768444691a2e276f3c69e99a9f5251168aaa7fd2a89a649043
-size 5955494

data/datasets/local/open-asssistant-conversations/text/spacy_ner/signal_manifest.json DELETED Viewed

@@ -1,38 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "spacy_ner(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "spacy_ner": {
- "repeated_field": {
- "fields": {
- "label": {
- "dtype": "string"
- }
- },
- "dtype": "string_span"
- },
- "signal": {
- "model": "en_core_web_sm",
- "signal_name": "spacy_ner"
- }
- }
- }
- }
- }
- },
- "signal": {
- "model": "en_core_web_sm",
- "signal_name": "spacy_ner"
- },
- "enriched_path": [
- "text"
- ]
-}

data/datasets/local/open-asssistant-conversations/text/text_statistics/data-00000-of-00001.parquet DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a1adb0c31662191820bcffbefd09c00ecdc101bbc41b9941179ff0b4fd78d11b
-size 3827236

data/datasets/local/open-asssistant-conversations/text/text_statistics/signal_manifest.json DELETED Viewed

@@ -1,59 +0,0 @@
-{
- "files": [
- "data-00000-of-00001.parquet"
- ],
- "parquet_id": "text_statistics(text)",
- "data_schema": {
- "fields": {
- "__rowid__": {
- "dtype": "string"
- },
- "text": {
- "fields": {
- "text_statistics": {
- "fields": {
- "num_characters": {
- "dtype": "int32"
- },
- "readability": {
- "dtype": "float32"
- },
- "log(type_token_ratio)": {
- "dtype": "float32"
- },
- "frac_non_ascii": {
- "dtype": "float32",
- "bins": [
- [
- "Low",
- null,
- 0.15
- ],
- [
- "Medium",
- 0.15,
- 0.3
- ],
- [
- "High",
- 0.3,
- null
- ]
- ]
- }
- },
- "signal": {
- "signal_name": "text_statistics"
- }
- }
- }
- }
- }
- },
- "signal": {
- "signal_name": "text_statistics"
- },
- "enriched_path": [
- "text"
- ]
-}

lilac/concepts/db_concept.py CHANGED Viewed

@@ -366,6 +366,7 @@ class DiskConceptDB(ConceptDB):
  f'Concept "{namespace}/{name}" does not exist or user does not have access.')
  concept_json_path = _concept_json_path(self._get_base_dir(), namespace, name)
  if not file_exists(concept_json_path):
  return None

  f'Concept "{namespace}/{name}" does not exist or user does not have access.')
  concept_json_path = _concept_json_path(self._get_base_dir(), namespace, name)
+ print('json path=', concept_json_path)
  if not file_exists(concept_json_path):
  return None