一、下载语音听写(流式版)SDK
科大讯飞官网:https://www.xfyun.cn/
1.1 实名认证
首先登陆讯飞开放平台:https://passport.xfyun.cn/login,微信扫码关注登录
注册新账号
登陆后界面后,进入产品服务–>实时语音转写栏目
点击个人免费套餐,下面的立即领取,它会提醒我们去实名认证
实名认证一下
提交完认证之后
可以看到认证成功
回到平台领取界面,就可以领取了
1.2 创建应用并试用免费购买版
点击右边的+号创建应用,很简单的,然后才能提交(不然会提示你还没有创建应用,不让提交)
确认下单
设置下支付密码
确认支付就好了
1.3 下载SDK
在控制台进入后有如下界面,点击语音听写,往下翻就可以找到Java MSC,点击下载就好了
红色箭头指向的是我们上一步创建的的项目名称
解压后目录如下:
1.4 一般我们使用SDK调用方式的话,只需要用到APPID。
在本地IDEA项目中使用的话,使用的是自己项目中下载的SDK包
,和自己官网的Appid
。否则SDK包和Appid不对应的话会报错
二、使用IDEA建立项目并实现【一定要使用自己官网的SDK和Appid对应,否则会出错10407】
2.1 在IDEA中新建Maven项目
2.2 在java下新建com.zhj.voice包,写入VoiceSpeech类,导入MSC的jar包
VoiceSpeech类完整代码如下:【注意导入的各个包名】
package com.zhj.voice;
/**
* Topic
* Description
*
* @author zhouh
* @version 1.0
* Create by 2022/8/3 10:58
*/
import java.awt.Button;
import java.awt.Font;
import java.awt.Frame;
import java.awt.GridLayout;
import java.awt.Panel;
import java.awt.TextArea;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.lang.reflect.Parameter;
import java.util.ArrayList;
import javax.swing.ImageIcon;
import javax.swing.JFrame;
import javax.swing.JLabel;
import com.iflytek.cloud.speech.RecognizerListener;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechRecognizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.util.DebugLog;
import com.iflytek.util.JsonParser;
import com.iflytek.util.Version;
public class VoiceSpeech extends Frame implements ActionListener {
Button startBtn;
Button stopBtn;
TextArea textArea;
// 语音听写对象
SpeechRecognizer speechRecognize;
private static final String DEF_FONT_NAME = "宋体";
private static final int DEF_FONT_STYLE = Font.BOLD;
private static final int DEF_FONT_SIZE = 30;
private static final int TEXT_COUNT = 100;
public VoiceSpeech() {
// 初始化听写对象
speechRecognize = SpeechRecognizer.createRecognizer();
// 设置组件
startBtn = new Button("start");
stopBtn = new Button("stop");
textArea = new TextArea();
Panel btnPanel = new Panel();
Panel textPanel = new Panel();
// Button startBtn = new Button("开始");
//添加监听器
startBtn.addActionListener(this);
stopBtn.addActionListener(this);
btnPanel.add(startBtn);
btnPanel.add(stopBtn);
textPanel.add(textArea);
add(btnPanel);
add(textPanel);
// 设置窗体
setLayout(new GridLayout(2, 1));
setSize(400, 300);
setTitle("语音识别");
setLocation(200, 200);
setVisible(true);
}
public void actionPerformed(ActionEvent e) {
if (e.getSource() == startBtn) {
textArea.setText("*************你说的是:");
if (!speechRecognize.isListening())
speechRecognize.startListening(recognizerListener);
else
speechRecognize.stopListening();
} else if (e.getSource() == stopBtn) {
speechRecognize.stopListening();
}
}
/**
* 听写监听器
*/
private RecognizerListener recognizerListener = new RecognizerListener() {
public void onBeginOfSpeech() {
// DebugLog.Log( "onBeginOfSpeech enter" );
// ((JLabel) jbtnRecognizer.getComponent(0)).setText("听写中...");
// jbtnRecognizer.setEnabled(false);
}
public void onEndOfSpeech() {
DebugLog.Log("onEndOfSpeech enter");
}
/**
* 获取听写结果. 获取RecognizerResult类型的识别结果,并对结果进行累加,显示到Area里
*/
public void onResult(RecognizerResult results, boolean islast) {
DebugLog.Log("onResult enter");
// 如果要解析json结果,请考本项目示例的 com.iflytek.util.JsonParser类
String text =
JsonParser.parseIatResult(results.getResultString());
// String text = results.getResultString();
// JsonParser json = new JsonParser();
// String newTest = json.parseIatResult(text);
// textArea.setText(newTest);
textArea.append(text);
text = textArea.getText();
if (null != text) {
int n = text.length() / TEXT_COUNT + 1;
int fontSize = Math.max(10, DEF_FONT_SIZE - 2 * n);
DebugLog.Log("onResult new font size=" + fontSize);
int style = n > 1 ? Font.PLAIN : DEF_FONT_SIZE;
Font newFont = new Font(DEF_FONT_NAME, style, fontSize);
textArea.setFont(newFont);
}
if (islast) {
iatSpeechInitUI();
}
}
public void onVolumeChanged(int volume) {
DebugLog.Log("onVolumeChanged enter");
if (volume == 0)
volume = 1;
else if (volume >= 6)
volume = 6;
// labelWav.setIcon(new ImageIcon("res/mic_0" + volume + ".png"));
}
public void onError(SpeechError error) {
DebugLog.Log("onError enter");
if (null != error) {
DebugLog.Log("onError Code:" + error.getErrorCode());
textArea.setText(error.getErrorDescription(true));
iatSpeechInitUI();
}
}
public void onEvent(int eventType, int arg1, int agr2, String msg) {
DebugLog.Log("onEvent enter");
}
};
/**
* 听写结束,恢复初始状态
*/
public void iatSpeechInitUI() {
// labelWav.setIcon(new ImageIcon("res/mic_01.png"));
// jbtnRecognizer.setEnabled(true);
// ((JLabel) jbtnRecognizer.getComponent(0)).setText("开始听写");
}
public static void main(String[] args) {
// 初始化
StringBuffer param = new StringBuffer();
param.append( "appid=" + Version.getAppid() );
// param.append( ","+SpeechConstant.LIB_NAME_32+"=myMscName" );
SpeechUtility.createUtility( param.toString() );
VoiceSpeech t = new VoiceSpeech();
}
}
接着可能会有包名爆红,提醒我们导入Jar包
我们找到1.3中下载好的SDK文件夹下,进入下面的lib–>lib目录下,找到两个jar包。【注意,Java_iat1021_a8641a01 (1)是我下载的SDK解压后的名字】
然后将两个jar包导入到项目中:
点击ok发现com.iflytek.cloud.speech
相关的不爆红了
但是com.iflytek.util
相关的import仍然会爆红,所以我这里下一步是选择在com目录下手动新建iflytek.util包【使其能够手动导入】
2.3 手动新建iflytek.util包,复制导入文件
但是com.iflytek.util
相关的import仍然会爆红,所以我这里是选择在com目录下手动新建iflytek.util包【使其能够手动导入】
之后找到1.2步下载解压后的SDK文件夹中的sample
跟着目录找到sample–>src–>com–>iflytek–>util下的6个类
全选,复制粘贴到我们本地IDEA的对应包com.iflytek.util下
(这里包下Version类名中显示蓝色,是因为我已经上传到github上
并且本地IDEA修改代码了
,所以会显示蓝色)
这时候会发现不报错了,所有的import都正常显示了
2.4 修改com.iflytek.util.Version类中的getAppid方法返回值,为自己的Appid
修改com.iflytek.util.Version类中的getAppid方法返回值为我们科大讯飞官网中项目的Appid,因为返回String类型
,记得Appid加双引号:
"自己的Appid号"
Appid号在1.4节的时候得到了:
2.5 复制我们SDK中的.so和.dll文件一共4个到项目根目录下
在本地下载解压好的SDK问价夹中找到lib–>lib包下的这4个文件,Ctrl+A后,Ctrl+C全选复制
然后粘贴到本地IDEA的项目根目录下就好了
完整工程目录如下:
至此,项目搭建就完成了。
三、启动项目
进入VoiceSpeech类中运行main函数就可以成功启动项目且不报错了:
运行后会弹出弹框,点击start说话就可以识别到了。
识别后想要再次说话识别,点击stop后再点击start就可以了
四、常见报错
-
使用科大飞讯语音合成报 20021 引擎错误
:原因和解决参考我的这一篇博客使用科大飞讯语音合成SDK报 20021 引擎错误 - 关
于讯飞科大导入的10407问题
:原因(没复制.so和.ddl文件)和解决办法参考我的这一篇博客关于讯飞科大语音识别SDK导入的10407问题
参考:在Java中实现在线语音识别文章来源:https://www.toymoban.com/news/detail-419832.html
Idea导入jar包的两种方法文章来源地址https://www.toymoban.com/news/detail-419832.html
到了这里,关于Java中实现在线语音识别(科大讯飞免费的SKD)、SDK下载和IDEA项目搭建、成功运行【完整代码】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!