Java 實現(xiàn)麥克風(fēng)自動錄音
最近在研究語音識別,使用百度的sdk。發(fā)現(xiàn)只有識別的部分,而我需要保存音頻文件,并且實現(xiàn)當(dāng)有聲音傳入時自動生成音頻文件。
先上代碼:
public class EngineeCore { String filePath = 'E:voicevoice_cache.wav'; AudioFormat audioFormat; TargetDataLine targetDataLine; boolean flag = true;private void stopRecognize() { flag = false; targetDataLine.stop(); targetDataLine.close(); }private AudioFormat getAudioFormat() { float sampleRate = 16000; // 8000,11025,16000,22050,44100 int sampleSizeInBits = 16; // 8,16 int channels = 1; // 1,2 boolean signed = true; // true,false boolean bigEndian = false; // true,false return new AudioFormat(sampleRate, sampleSizeInBits, channels, signed, bigEndian); }// end getAudioFormat private void startRecognize() { try { // 獲得指定的音頻格式 audioFormat = getAudioFormat(); DataLine.Info dataLineInfo = new DataLine.Info(TargetDataLine.class, audioFormat); targetDataLine = (TargetDataLine) AudioSystem.getLine(dataLineInfo); // Create a thread to capture the microphone // data into an audio file and start the // thread running. It will run until the // Stop button is clicked. This method // will return after starting the thread. flag = true; new CaptureThread().start(); } catch (Exception e) { e.printStackTrace(); } // end catch }// end captureAudio method class CaptureThread extends Thread { public void run() { AudioFileFormat.Type fileType = null; File audioFile = new File(filePath); fileType = AudioFileFormat.Type.WAVE; //聲音錄入的權(quán)值 int weight = 2; //判斷是否停止的計數(shù) int downSum = 0; ByteArrayInputStream bais = null; ByteArrayOutputStream baos = new ByteArrayOutputStream(); AudioInputStream ais = null; try {targetDataLine.open(audioFormat);targetDataLine.start();byte[] fragment = new byte[1024];ais = new AudioInputStream(targetDataLine);while (flag) { targetDataLine.read(fragment, 0, fragment.length); //當(dāng)數(shù)組末位大于weight時開始存儲字節(jié)(有聲音傳入),一旦開始不再需要判斷末位 if (Math.abs(fragment[fragment.length-1]) > weight || baos.size() > 0) { baos.write(fragment); System.out.println('守衛(wèi):'+fragment[0]+',末尾:'+fragment[fragment.length-1]+',lenght'+fragment.length); //判斷語音是否停止 if(Math.abs(fragment[fragment.length-1])<=weight){ downSum++; }else{ System.out.println('重置奇數(shù)'); downSum=0; } //計數(shù)超過20說明此段時間沒有聲音傳入(值也可更改) if(downSum>20){ System.out.println('停止錄入'); break; } }}//取得錄音輸入流audioFormat = getAudioFormat();byte audioData[] = baos.toByteArray();bais = new ByteArrayInputStream(audioData);ais = new AudioInputStream(bais, audioFormat, audioData.length / audioFormat.getFrameSize());//定義最終保存的文件名System.out.println('開始生成語音文件');AudioSystem.write(ais, AudioFileFormat.Type.WAVE, audioFile);downSum = 0;stopRecognize(); } catch (Exception e) {e.printStackTrace(); } finally {//關(guān)閉流try { ais.close(); bais.close(); baos.reset();} catch (IOException e) { e.printStackTrace();} } }// end run }// end inner class CaptureThread
接下來測試
public static void main(String args[]) { EngineeCore engineeCore = new EngineeCore(); engineeCore.startRecognize(); }
當(dāng)有較高的聲音傳入麥克風(fēng)時,targetDataLine讀取的字節(jié)數(shù)組首位或末位絕對值會變大(位置取決于音頻格式中的一些參數(shù),如bigEndian)。傳入音量低,絕對值會變小
錄音開始。從targetDataLine中讀取的音頻數(shù)據(jù)被保存在ByteArrayOutputStream中。一段時間音量一直低于權(quán)值時,認為無聲音傳入,結(jié)束錄音。從ByteArrayOutputStream取出字節(jié)數(shù)組,
轉(zhuǎn)為音頻保存在本地文件中。
注意:從targetDataLine讀取的字節(jié)數(shù)組不能直接用于百度等語音識別,需要先轉(zhuǎn)為音頻文件,然后讀取音頻文件生成的字節(jié)數(shù)組,才可用于語音識別。
以上就是Java 實現(xiàn)麥克風(fēng)自動錄音的詳細內(nèi)容,更多關(guān)于Java 麥克風(fēng)自動錄音的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 詳解Android studio 動態(tài)fragment的用法2. 什么是python的自省3. 解決Android studio xml界面無法預(yù)覽問題4. Spring Boot和Thymeleaf整合結(jié)合JPA實現(xiàn)分頁效果(實例代碼)5. 圖文詳解vue中proto文件的函數(shù)調(diào)用6. php模擬實現(xiàn)斗地主發(fā)牌7. Springboot Druid 自定義加密數(shù)據(jù)庫密碼的幾種方案8. Vue封裝一個TodoList的案例與瀏覽器本地緩存的應(yīng)用實現(xiàn)9. vue 使用localstorage實現(xiàn)面包屑的操作10. Vuex localStorage的具體使用

網(wǎng)公網(wǎng)安備