Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +1 -2
generation_config.json +1 -1
onnx/decoder_model_merged.onnx +1 -1
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quant_config.json +89 -0

config.json CHANGED Viewed

@@ -139,8 +139,7 @@
     50360,
     50361
   ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51864

     50360,
     50361
   ],
+  "transformers_version": "4.30.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51864

generation_config.json CHANGED Viewed

@@ -109,5 +109,5 @@
     50360,
     50361
   ],
-  "transformers_version": "4.29.2"
 }

     50360,
     50361
   ],
+  "transformers_version": "4.30.2"
 }

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2746e6eee2fc3dacc4ee3aa7024782755da6b3b4b351aad9ed573d14682e503a
 size 774588347

 version https://git-lfs.github.com/spec/v1
+oid sha256:821a0fae52d92575d988421df91cc2792827b58f42d6274324fa184a592dc6a2
 size 774588347

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38ddd300ced7653406425d69833e2d7901f36edd4767d2663896b026d467e90d
-size 197289993

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba8567520a70349d064d7ffec5f440e78a149bf5968bfedd94ad78b6287e8798
+size 196431022

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d44e700708c59e0498b8b986a817f69ce311e25a9cd01df4f9b5ebf4f118a10
-size 196596602

 version https://git-lfs.github.com/spec/v1
+oid sha256:053b11d598b22f489e0075714ca9191f4016c356544131b908f2eb87648d72c2
+size 195737631

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a2b697c212ac0e55fce6fcbfd0053ac1f2253c2394d881479529dec251d0767
-size 182183920

 version https://git-lfs.github.com/spec/v1
+oid sha256:b5b511413b04bb36148c2b45799223c14d5075bd6b1f16d16145d14fb6adc57f
+size 181417229

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f25862e6297bed816b7ec75f51b0c1f937e312e1032362b579f4cd6e1c8b4395
-size 92704740

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc7c82e4908c040e156b4063f6cc319b5f31d68ff5812a7e4ac05659cb88ac5c
+size 92289703

quant_config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "encoder_model": {
+            "op_types": [
+                "Add",
+                "Gather",
+                "Mul",
+                "Pow",
+                "Sub",
+                "Conv",
+                "MatMul",
+                "Erf",
+                "Transpose",
+                "Sqrt",
+                "Constant",
+                "Shape",
+                "Softmax",
+                "Unsqueeze",
+                "Div",
+                "Concat",
+                "Reshape",
+                "ReduceMean"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "MatMul",
+                "Squeeze",
+                "Shape",
+                "Div",
+                "Reshape",
+                "ReduceMean",
+                "Gather",
+                "Cast",
+                "Mul",
+                "Expand",
+                "Pow",
+                "Erf",
+                "Slice",
+                "Transpose",
+                "Constant",
+                "Softmax",
+                "Unsqueeze",
+                "Concat",
+                "ConstantOfShape",
+                "Equal",
+                "Where",
+                "Range",
+                "Sub",
+                "Less",
+                "Add",
+                "Sqrt"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "If"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Gather",
+                "Add",
+                "Mul",
+                "Pow",
+                "Sub",
+                "MatMul",
+                "Erf",
+                "Slice",
+                "Transpose",
+                "Sqrt",
+                "Constant",
+                "Shape",
+                "Softmax",
+                "Unsqueeze",
+                "Concat",
+                "Div",
+                "Reshape",
+                "ReduceMean"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}