Spaces:

Arnaudding001
/

OpenAI_whisperLive

Runtime error

App Files Files Community

Arnaudding001 commited on Nov 7, 2022

Commit

f9732d0

1 Parent(s): d30ef31

Upload 2 files

Browse files

Files changed (2) hide show

segments_test.py +48 -0
vad_test.py +66 -0

segments_test.py ADDED Viewed

	@@ -0,0 +1,48 @@

+import sys
+import unittest
+sys.path.append('../whisper-webui')
+from src.segments import merge_timestamps
+class TestSegments(unittest.TestCase):
+    def __init__(self, *args, **kwargs):
+        super(TestSegments, self).__init__(*args, **kwargs)
+    def test_merge_segments(self):
+        segments = [
+            {'start': 10.0, 'end': 20.0},
+            {'start': 22.0, 'end': 27.0},
+            {'start': 31.0, 'end': 35.0},
+            {'start': 45.0, 'end': 60.0},
+            {'start': 61.0, 'end': 65.0},
+            {'start': 68.0, 'end': 98.0},
+            {'start': 100.0, 'end': 102.0},
+            {'start': 110.0, 'end': 112.0}
+        ]
+        result = merge_timestamps(segments, merge_window=5, max_merge_size=30, padding_left=1, padding_right=1)
+        self.assertListEqual(result, [
+            {'start': 9.0, 'end': 36.0},
+            {'start': 44.0, 'end': 66.0},
+            {'start': 67.0, 'end': 99.0},
+            {'start': 99.0, 'end': 103.0},
+            {'start': 109.0, 'end': 113.0}
+        ])
+    def test_overlap_next(self):
+        segments = [
+            {'start': 5.0, 'end': 39.182},
+            {'start': 39.986, 'end': 40.814}
+        ]
+        result = merge_timestamps(segments, merge_window=5, max_merge_size=30, padding_left=1, padding_right=1)
+        self.assertListEqual(result, [
+            {'start': 4.0, 'end': 39.584},
+            {'start': 39.584, 'end': 41.814}
+        ])
+if __name__ == '__main__':
+    unittest.main()

vad_test.py ADDED Viewed

	@@ -0,0 +1,66 @@

+import pprint
+import unittest
+import numpy as np
+import sys
+sys.path.append('../whisper-webui')
+from src.vad import AbstractTranscription, VadSileroTranscription
+class TestVad(unittest.TestCase):
+    def __init__(self, *args, **kwargs):
+        super(TestVad, self).__init__(*args, **kwargs)
+        self.transcribe_calls = []
+    def test_transcript(self):
+        mock = MockVadTranscription()
+        self.transcribe_calls.clear()
+        result = mock.transcribe("mock", lambda segment : self.transcribe_segments(segment))
+        self.assertListEqual(self.transcribe_calls, [
+            [30, 30],
+            [100, 100]
+        ])
+        self.assertListEqual(result['segments'],
+            [{'end': 50.0, 'start': 40.0, 'text': 'Hello world '},
+            {'end': 120.0, 'start': 110.0, 'text': 'Hello world '}]
+        )
+    def transcribe_segments(self, segment):
+        self.transcribe_calls.append(segment.tolist())
+        # Dummy text
+        return {
+            'text': "Hello world ",
+            'segments': [
+                {
+                    "start": 10.0,
+                    "end": 20.0,
+                    "text": "Hello world "
+                }
+            ],
+            'language': ""
+        }
+class MockVadTranscription(AbstractTranscription):
+    def __init__(self):
+        super().__init__()
+    def get_audio_segment(self, str, start_time: str = None, duration: str = None):
+        start_time_seconds = float(start_time.removesuffix("s"))
+        duration_seconds = float(duration.removesuffix("s"))
+        # For mocking, this just returns a simple numppy array
+        return np.array([start_time_seconds, duration_seconds], dtype=np.float64)
+    def get_transcribe_timestamps(self, audio: str):
+        result = []
+        result.append( {  'start': 30, 'end': 60 } )
+        result.append( {  'start': 100, 'end': 200 } )
+        return result
+if __name__ == '__main__':
+    unittest.main()