fix json code style.

3 years ago · ae98cc8bbf
parent ab288ff2ef
commit ae98cc8bbf
7 changed files with 100573 additions and 7 deletions
--- a/paddlespeech/s2t/models/whisper/assets/gpt2/special_tokens_map.json
+++ b/paddlespeech/s2t/models/whisper/assets/gpt2/special_tokens_map.json
@ -1 +1,5 @@
-{"bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "unk_token": "<|endoftext|>"}
+{
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}
--- a/paddlespeech/s2t/models/whisper/assets/gpt2/tokenizer_config.json
+++ b/paddlespeech/s2t/models/whisper/assets/gpt2/tokenizer_config.json
@ -1 +1,10 @@
-{"unk_token": "<|endoftext|>", "bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "add_prefix_space": false, "model_max_length": 1024, "special_tokens_map_file": null, "name_or_path": "gpt2", "tokenizer_class": "GPT2Tokenizer"}
+{
+  "unk_token": "<|endoftext|>",
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "add_prefix_space": false,
+  "model_max_length": 1024,
+  "special_tokens_map_file": null,
+  "name_or_path": "gpt2",
+  "tokenizer_class": "GPT2Tokenizer"
+}
--- a/paddlespeech/s2t/models/whisper/assets/gpt2/vocab.json
+++ b/paddlespeech/s2t/models/whisper/assets/gpt2/vocab.json
--- a/paddlespeech/s2t/models/whisper/assets/multilingual/added_tokens.json
+++ b/paddlespeech/s2t/models/whisper/assets/multilingual/added_tokens.json
@ -1 +1,3 @@
-{"<|endoftext|>": 50257}
+{
+  "<|endoftext|>": 50257
+}
--- a/paddlespeech/s2t/models/whisper/assets/multilingual/special_tokens_map.json
+++ b/paddlespeech/s2t/models/whisper/assets/multilingual/special_tokens_map.json
@ -1 +1,5 @@
-{"bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "unk_token": "<|endoftext|>"}
+{
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}
--- a/paddlespeech/s2t/models/whisper/assets/multilingual/tokenizer_config.json
+++ b/paddlespeech/s2t/models/whisper/assets/multilingual/tokenizer_config.json
@ -1 +1,32 @@
-{"unk_token": {"content": "<|endoftext|>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "bos_token": {"content": "<|endoftext|>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "eos_token": {"content": "<|endoftext|>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "add_prefix_space": false, "model_max_length": 1024, "special_tokens_map_file": null, "name_or_path": "multilingual", "errors": "replace", "tokenizer_class": "GPT2Tokenizer"}
+{
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "single_word": false,
+    "lstrip": false,
+    "rstrip": false,
+    "normalized": true,
+    "__type": "AddedToken"
+  },
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "single_word": false,
+    "lstrip": false,
+    "rstrip": false,
+    "normalized": true,
+    "__type": "AddedToken"
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "single_word": false,
+    "lstrip": false,
+    "rstrip": false,
+    "normalized": true,
+    "__type": "AddedToken"
+  },
+  "add_prefix_space": false,
+  "model_max_length": 1024,
+  "special_tokens_map_file": null,
+  "name_or_path": "multilingual",
+  "errors": "replace",
+  "tokenizer_class": "GPT2Tokenizer"
+}
--- a/paddlespeech/s2t/models/whisper/assets/multilingual/vocab.json
+++ b/paddlespeech/s2t/models/whisper/assets/multilingual/vocab.json