sox 1.mp3 -r 44.1k -c 1 -b 16 2.wav
Сравнение двух аудиосообщений с использованием библиотеки Librosa.
Librosa — библиотека, которая обеспечивает анализ и обработку звука. Сравнение производится путем вычисления характеристик MFCC (Mel Frequency Cepstral Coefficients), описывающих звуковую сигнатуру каждого аудио.
Важные замечания:
— Для точного сравнения аудиозаписей они должны иметь одинаковую продолжительность и аналогичные условия записи (громкость, уровень шума и т.д.).
— Возможно потребуется дополнительная предварительная обработка, например, нормализация громкости.
librosa.version
'0.10.1'
AttributeError: No librosa.core attribute dtln
Возможное решение:
dist = mfcc1 - mfcc2
print(f'Distance between audios is {((dist ** 2).sum(axis=0) ** 0.5).sum()}')
Import them both into Audacity. Apply the “Invert” effect to one of the tracks. Select both tracks, then from the “Tracks menu > Mix and Render”. If the tracks were identical, the result will be silence. To check that it is absolute silence, select the full (mix) track, and open the “Amplify” effect. If the Amplify effect says that the “New Peak Amplitude” is “-infinity”, then the mix track is totally silent and the two imported files have identical audio.