使用vgnish构建音频搜索

2021-04-05 21:46:26

要运行此示例,您应该在系统中具有youtube-dl,ffmpeg。请参阅具体的安装说明。

对于MacOS用户,更需要一个LibMagICInalAllation,可以通过运行获得

您可以通过运行以下内容添加此示例所需的Python库:

在此示例中,我们使用VAGATH模型来编码声音文件。您可以在https://github.com/tensorflow/models/tree/master/research/audioset/vggish中找到有关该模型的更多详细信息。使用以下CMD下载模型。如图下载了audioset数据,我们将在https://github.com/qiuqiangkong/autioset_tagging_cnn中调整从runme.sh脚本的代码。我们提供以下脚本,它将从Audioset DataSet下载10个音频文件。

。──────────── .wav│└──yjzij1ux73ku.wav├──download_data.sh├──download_model.sh├──流动│├──index.yml│──query.yml├──get_data.sh── ├──vggish_model.ckpt││──vggish_pca_params.npz├──pods││───comunk_merger.yml││──定制_executors.py│├──doc.yml│──编码。yml││── 。ym├──段.Yml││──vec.yml││──vgnish││──梅尔_features.py││──vggish_input.py││──vggish_params.py││──vggish_postprocess.py│ └──vggish_slim.py├──────────────────yjo9lfbgxf_0.wav│───yjzij1ux73ku.wav└─ - test_audio_search.py​​.yjmn-c5mdxfw.wav└── - test_audio_search.py

或者,您也可以使用您自己的.wav文件。确保文件属于数据/。例如,我们的get_data.sh脚本从Wikimedia Commons下载了几个贝多芬交响曲。这是一个小型数据集,因此快速索引。赶紧跑

学习Jina深入了解的最佳方式是阅读我们的文档。文档构建了主分支的每个推送,合并和发布事件。有关详细信息,请退房: