Spaces:

yqsong
/

execution_accuracy

Running

yqsong commited on Nov 23, 2023

Commit

8ff2c2a

•

1 Parent(s): 196f8b3

fix

Files changed (2) hide show

execution_accuracy.py CHANGED Viewed

@@ -94,13 +94,13 @@ class ExecutionAccuracy(evaluate.Metric):
         for prediction, reference, db_url in zip(predictions, references, db_urls):
             db = Database(db_url)
             try:
-                pred = db.query(predictions).as_dict()
             except Exception as e:
-                pred = []
             try:
-                ref = db.query(references).as_dict()
             except Exception as e:
-                ref = []
             pred = [tuple(x.values()) for x in pred]
             ref = [tuple(x.values()) for x in ref]
             if len(pred) == len(ref):
@@ -110,5 +110,5 @@ class ExecutionAccuracy(evaluate.Metric):
                     cnt += 1
         accuracy = cnt / len(predictions)
         return {
-            "execution accuracy": accuracy,
         }

         for prediction, reference, db_url in zip(predictions, references, db_urls):
             db = Database(db_url)
             try:
+                pred = db.query(prediction).as_dict()
             except Exception as e:
+                pred = {}
             try:
+                ref = db.query(reference).as_dict()
             except Exception as e:
+                ref = {}
             pred = [tuple(x.values()) for x in pred]
             ref = [tuple(x.values()) for x in ref]
             if len(pred) == len(ref):
                     cnt += 1
         accuracy = cnt / len(predictions)
         return {
+            "execution_accuracy": accuracy,
         }

tests.py DELETED Viewed

@@ -1,17 +0,0 @@
-test_cases = [
-    {
-        "predictions": [0, 0],
-        "references": [1, 1],
-        "result": {"metric_score": 0}
-    },
-    {
-        "predictions": [1, 1],
-        "references": [1, 1],
-        "result": {"metric_score": 1}
-    },
-    {
-        "predictions": [1, 0],
-        "references": [1, 1],
-        "result": {"metric_score": 0.5}
-    }
-]