diff --git "a/gpt_bigcode-santacoder-q3f16_0/params/ndarray-cache.json" "b/gpt_bigcode-santacoder-q3f16_0/params/ndarray-cache.json" new file mode 100644--- /dev/null +++ "b/gpt_bigcode-santacoder-q3f16_0/params/ndarray-cache.json" @@ -0,0 +1,4247 @@ +{ + "metadata": { + "ParamSize": 391 + }, + "records": [ + { + "dataPath": "params_shard_0.bin", + "format": "raw-shard", + "nbytes": 41000960, + "records": [ + { + "name": "param_195", + "shape": [ + 49280, + 416 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 41000960, + "byteOffset": 0 + } + ] + }, + { + "dataPath": "params_shard_1.bin", + "format": "raw-shard", + "nbytes": 33074176, + "records": [ + { + "name": "param_0", + "shape": [ + 2048, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 8388608, + "byteOffset": 0 + }, + { + "name": "param_1", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8388608 + }, + { + "name": "param_2", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8392704 + }, + { + "name": "param_3", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8396800 + }, + { + "name": "param_4", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8400896 + }, + { + "name": "param_5", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8404992 + }, + { + "name": "param_6", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8409600 + }, + { + "name": "param_7", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8413696 + }, + { + "name": "param_8", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8430080 + }, + { + "name": "param_9", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8434176 + }, + { + "name": "param_10", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8438272 + }, + { + "name": "param_11", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8442368 + }, + { + "name": "param_12", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8446464 + }, + { + "name": "param_13", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8450560 + }, + { + "name": "param_14", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8455168 + }, + { + "name": "param_15", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8459264 + }, + { + "name": "param_16", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8475648 + }, + { + "name": "param_17", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8479744 + }, + { + "name": "param_18", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8483840 + }, + { + "name": "param_19", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8487936 + }, + { + "name": "param_20", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8492032 + }, + { + "name": "param_21", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8496128 + }, + { + "name": "param_22", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8500736 + }, + { + "name": "param_23", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8504832 + }, + { + "name": "param_24", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8521216 + }, + { + "name": "param_25", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8525312 + }, + { + "name": "param_26", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8529408 + }, + { + "name": "param_27", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8533504 + }, + { + "name": "param_28", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8537600 + }, + { + "name": "param_29", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8541696 + }, + { + "name": "param_30", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8546304 + }, + { + "name": "param_31", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8550400 + }, + { + "name": "param_32", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8566784 + }, + { + "name": "param_33", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8570880 + }, + { + "name": "param_34", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8574976 + }, + { + "name": "param_35", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8579072 + }, + { + "name": "param_36", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8583168 + }, + { + "name": "param_37", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8587264 + }, + { + "name": "param_38", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8591872 + }, + { + "name": "param_39", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8595968 + }, + { + "name": "param_40", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8612352 + }, + { + "name": "param_41", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8616448 + }, + { + "name": "param_42", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8620544 + }, + { + "name": "param_43", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8624640 + }, + { + "name": "param_44", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8628736 + }, + { + "name": "param_45", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8632832 + }, + { + "name": "param_46", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8637440 + }, + { + "name": "param_47", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8641536 + }, + { + "name": "param_48", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8657920 + }, + { + "name": "param_49", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8662016 + }, + { + "name": "param_50", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8666112 + }, + { + "name": "param_51", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8670208 + }, + { + "name": "param_52", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8674304 + }, + { + "name": "param_53", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8678400 + }, + { + "name": "param_54", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8683008 + }, + { + "name": "param_55", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8687104 + }, + { + "name": "param_56", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8703488 + }, + { + "name": "param_57", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8707584 + }, + { + "name": "param_58", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8711680 + }, + { + "name": "param_59", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8715776 + }, + { + "name": "param_60", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8719872 + }, + { + "name": "param_61", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8723968 + }, + { + "name": "param_62", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8728576 + }, + { + "name": "param_63", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8732672 + }, + { + "name": "param_64", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8749056 + }, + { + "name": "param_65", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8753152 + }, + { + "name": "param_66", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8757248 + }, + { + "name": "param_67", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8761344 + }, + { + "name": "param_68", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8765440 + }, + { + "name": "param_69", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8769536 + }, + { + "name": "param_70", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8774144 + }, + { + "name": "param_71", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8778240 + }, + { + "name": "param_72", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8794624 + }, + { + "name": "param_73", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8798720 + }, + { + "name": "param_74", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8802816 + }, + { + "name": "param_75", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8806912 + }, + { + "name": "param_76", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8811008 + }, + { + "name": "param_77", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8815104 + }, + { + "name": "param_78", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8819712 + }, + { + "name": "param_79", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8823808 + }, + { + "name": "param_80", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8840192 + }, + { + "name": "param_81", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8844288 + }, + { + "name": "param_82", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8848384 + }, + { + "name": "param_83", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8852480 + }, + { + "name": "param_84", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8856576 + }, + { + "name": "param_85", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8860672 + }, + { + "name": "param_86", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8865280 + }, + { + "name": "param_87", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8869376 + }, + { + "name": "param_88", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8885760 + }, + { + "name": "param_89", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8889856 + }, + { + "name": "param_90", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8893952 + }, + { + "name": "param_91", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8898048 + }, + { + "name": "param_92", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8902144 + }, + { + "name": "param_93", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8906240 + }, + { + "name": "param_94", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8910848 + }, + { + "name": "param_95", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8914944 + }, + { + "name": "param_96", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8931328 + }, + { + "name": "param_97", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8935424 + }, + { + "name": "param_98", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8939520 + }, + { + "name": "param_99", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8943616 + }, + { + "name": "param_100", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8947712 + }, + { + "name": "param_101", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8951808 + }, + { + "name": "param_102", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8956416 + }, + { + "name": "param_103", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 8960512 + }, + { + "name": "param_104", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8976896 + }, + { + "name": "param_105", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8980992 + }, + { + "name": "param_106", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8985088 + }, + { + "name": "param_107", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8989184 + }, + { + "name": "param_108", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 8993280 + }, + { + "name": "param_109", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 8997376 + }, + { + "name": "param_110", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9001984 + }, + { + "name": "param_111", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9006080 + }, + { + "name": "param_112", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9022464 + }, + { + "name": "param_113", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9026560 + }, + { + "name": "param_114", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9030656 + }, + { + "name": "param_115", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9034752 + }, + { + "name": "param_116", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9038848 + }, + { + "name": "param_117", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9042944 + }, + { + "name": "param_118", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9047552 + }, + { + "name": "param_119", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9051648 + }, + { + "name": "param_120", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9068032 + }, + { + "name": "param_121", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9072128 + }, + { + "name": "param_122", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9076224 + }, + { + "name": "param_123", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9080320 + }, + { + "name": "param_124", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9084416 + }, + { + "name": "param_125", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9088512 + }, + { + "name": "param_126", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9093120 + }, + { + "name": "param_127", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9097216 + }, + { + "name": "param_128", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9113600 + }, + { + "name": "param_129", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9117696 + }, + { + "name": "param_130", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9121792 + }, + { + "name": "param_131", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9125888 + }, + { + "name": "param_132", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9129984 + }, + { + "name": "param_133", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9134080 + }, + { + "name": "param_134", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9138688 + }, + { + "name": "param_135", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9142784 + }, + { + "name": "param_136", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9159168 + }, + { + "name": "param_137", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9163264 + }, + { + "name": "param_138", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9167360 + }, + { + "name": "param_139", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9171456 + }, + { + "name": "param_140", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9175552 + }, + { + "name": "param_141", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9179648 + }, + { + "name": "param_142", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9184256 + }, + { + "name": "param_143", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9188352 + }, + { + "name": "param_144", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9204736 + }, + { + "name": "param_145", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9208832 + }, + { + "name": "param_146", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9212928 + }, + { + "name": "param_147", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9217024 + }, + { + "name": "param_148", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9221120 + }, + { + "name": "param_149", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9225216 + }, + { + "name": "param_150", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9229824 + }, + { + "name": "param_151", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9233920 + }, + { + "name": "param_152", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9250304 + }, + { + "name": "param_153", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9254400 + }, + { + "name": "param_154", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9258496 + }, + { + "name": "param_155", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9262592 + }, + { + "name": "param_156", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9266688 + }, + { + "name": "param_157", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9270784 + }, + { + "name": "param_158", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9275392 + }, + { + "name": "param_159", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9279488 + }, + { + "name": "param_160", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9295872 + }, + { + "name": "param_161", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9299968 + }, + { + "name": "param_162", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9304064 + }, + { + "name": "param_163", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9308160 + }, + { + "name": "param_164", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9312256 + }, + { + "name": "param_165", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9316352 + }, + { + "name": "param_166", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9320960 + }, + { + "name": "param_167", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9325056 + }, + { + "name": "param_168", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9341440 + }, + { + "name": "param_169", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9345536 + }, + { + "name": "param_170", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9349632 + }, + { + "name": "param_171", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9353728 + }, + { + "name": "param_172", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9357824 + }, + { + "name": "param_173", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9361920 + }, + { + "name": "param_174", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9366528 + }, + { + "name": "param_175", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9370624 + }, + { + "name": "param_176", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9387008 + }, + { + "name": "param_177", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9391104 + }, + { + "name": "param_178", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9395200 + }, + { + "name": "param_179", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9399296 + }, + { + "name": "param_180", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9403392 + }, + { + "name": "param_181", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9407488 + }, + { + "name": "param_182", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9412096 + }, + { + "name": "param_183", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9416192 + }, + { + "name": "param_184", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9432576 + }, + { + "name": "param_185", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9436672 + }, + { + "name": "param_186", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9440768 + }, + { + "name": "param_187", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9444864 + }, + { + "name": "param_188", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9448960 + }, + { + "name": "param_189", + "shape": [ + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4608, + "byteOffset": 9453056 + }, + { + "name": "param_190", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9457664 + }, + { + "name": "param_191", + "shape": [ + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 16384, + "byteOffset": 9461760 + }, + { + "name": "param_192", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9478144 + }, + { + "name": "param_193", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9482240 + }, + { + "name": "param_194", + "shape": [ + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 4096, + "byteOffset": 9486336 + }, + { + "name": "param_196", + "shape": [ + 49280, + 52 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 5125120, + "byteOffset": 9490432 + }, + { + "name": "param_197", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 14615552 + }, + { + "name": "param_198", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 16532480 + }, + { + "name": "param_199", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 16772096 + }, + { + "name": "param_200", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 18476032 + }, + { + "name": "param_201", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 18689024 + }, + { + "name": "param_202", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 25504768 + }, + { + "name": "param_203", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 26356736 + } + ] + }, + { + "dataPath": "params_shard_2.bin", + "format": "raw-shard", + "nbytes": 31879168, + "records": [ + { + "name": "param_204", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 0 + }, + { + "name": "param_205", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 839680 + }, + { + "name": "param_206", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 2756608 + }, + { + "name": "param_207", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 2996224 + }, + { + "name": "param_208", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 4700160 + }, + { + "name": "param_209", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 4913152 + }, + { + "name": "param_210", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 11728896 + }, + { + "name": "param_211", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 12580864 + }, + { + "name": "param_212", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 19298304 + }, + { + "name": "param_213", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 20137984 + }, + { + "name": "param_214", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 22054912 + }, + { + "name": "param_215", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 22294528 + }, + { + "name": "param_216", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 23998464 + }, + { + "name": "param_217", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 24211456 + }, + { + "name": "param_218", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 31027200 + } + ] + }, + { + "dataPath": "params_shard_3.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_219", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_220", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_221", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_222", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_223", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_224", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_225", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_226", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_227", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_228", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_229", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_230", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_231", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_232", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_4.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_233", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_234", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_235", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_236", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_237", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_238", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_239", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_240", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_241", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_242", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_5.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_243", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_244", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_245", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_246", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_247", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_248", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_249", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_250", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_251", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_252", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_253", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_254", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_255", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_256", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_6.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_257", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_258", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_259", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_260", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_261", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_262", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_263", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_264", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_265", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_266", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_7.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_267", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_268", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_269", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_270", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_271", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_272", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_273", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_274", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_275", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_276", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_277", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_278", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_279", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_280", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_8.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_281", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_282", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_283", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_284", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_285", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_286", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_287", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_288", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_289", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_290", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_9.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_291", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_292", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_293", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_294", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_295", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_296", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_297", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_298", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_299", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_300", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_301", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_302", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_303", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_304", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_10.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_305", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_306", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_307", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_308", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_309", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_310", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_311", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_312", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_313", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_314", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_11.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_315", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_316", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_317", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_318", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_319", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_320", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_321", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_322", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_323", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_324", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_325", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_326", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_327", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_328", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_12.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_329", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_330", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_331", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_332", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_333", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_334", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_335", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_336", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_337", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_338", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_13.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_339", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_340", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_341", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_342", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_343", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_344", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_345", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_346", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_347", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_348", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_349", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_350", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_351", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_352", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_14.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_353", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_354", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_355", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_356", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_357", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_358", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_359", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_360", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_361", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_362", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_15.bin", + "format": "raw-shard", + "nbytes": 30928896, + "records": [ + { + "name": "param_363", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_364", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_365", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 7557120 + }, + { + "name": "param_366", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 9474048 + }, + { + "name": "param_367", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 9713664 + }, + { + "name": "param_368", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 11417600 + }, + { + "name": "param_369", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 11630592 + }, + { + "name": "param_370", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 18446336 + }, + { + "name": "param_371", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 19298304 + }, + { + "name": "param_372", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 26015744 + }, + { + "name": "param_373", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 26855424 + }, + { + "name": "param_374", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 28772352 + }, + { + "name": "param_375", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 29011968 + }, + { + "name": "param_376", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 30715904 + } + ] + }, + { + "dataPath": "params_shard_16.bin", + "format": "raw-shard", + "nbytes": 26966016, + "records": [ + { + "name": "param_377", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 0 + }, + { + "name": "param_378", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 6815744 + }, + { + "name": "param_379", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 7667712 + }, + { + "name": "param_380", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 14385152 + }, + { + "name": "param_381", + "shape": [ + 416, + 2304 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1916928, + "byteOffset": 15224832 + }, + { + "name": "param_382", + "shape": [ + 52, + 2304 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 239616, + "byteOffset": 17141760 + }, + { + "name": "param_383", + "shape": [ + 416, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 1703936, + "byteOffset": 17381376 + }, + { + "name": "param_384", + "shape": [ + 52, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 212992, + "byteOffset": 19085312 + }, + { + "name": "param_385", + "shape": [ + 416, + 8192 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6815744, + "byteOffset": 19298304 + }, + { + "name": "param_386", + "shape": [ + 52, + 8192 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 851968, + "byteOffset": 26114048 + } + ] + }, + { + "dataPath": "params_shard_17.bin", + "format": "raw-shard", + "nbytes": 41000960, + "records": [ + { + "name": "param_389", + "shape": [ + 416, + 49280 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 41000960, + "byteOffset": 0 + } + ] + }, + { + "dataPath": "params_shard_18.bin", + "format": "raw-shard", + "nbytes": 12682240, + "records": [ + { + "name": "param_387", + "shape": [ + 1640, + 2048 + ], + "dtype": "uint16", + "format": "raw", + "nbytes": 6717440, + "byteOffset": 0 + }, + { + "name": "param_388", + "shape": [ + 205, + 2048 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 839680, + "byteOffset": 6717440 + }, + { + "name": "param_390", + "shape": [ + 52, + 49280 + ], + "dtype": "float16", + "format": "raw", + "nbytes": 5125120, + "byteOffset": 7557120 + } + ] + } + ] +} \ No newline at end of file