20212324 2023-2024-2 《移动平台开发与实践》第6次作业
我了解到该问题是由于虚拟机架构为x86,与jnilibs中不一致。首先我尝试了使用上次实验的包,但由于两个SDK不一致,失败了;问题3解决方案:在gradle.properties配置文件下添加如下代码之后Sync一下,即可解决。之后经过同学提醒,我发现竟然AS能够支持arm64架构的虚拟机!问题3:在使用老师代码时,出现case语句只能出现常量的报错。问题2解决方案:通过参考同学的博客及老师实验
·
文章目录
20212324 2023-2024-2 《移动平台开发与实践》第6次作业
1.实验内容和目的
- 掌握基于Android平台的程序设计技术,并能够编写完成语音识别系统。
- 设计并开发一个语音识别应用系统。
- 通过使用RecognizerIntent实现语音识别功能,开发一个Android语音识别系统。
2.实验过程
2.1配置开发环境
2.1.1在项目中集成SDK
- 下载开发包,将其拷贝至工程
2.1.2添加jar、so文件
- 在src/main/目录下新建jniLibs目录(如果的项目中已经包含该目录不用重复创建),在下载的开发包中拷贝项目中需要的CPU架构对应的so文件文件夹到jniLibs目录,如图:
- 在libs目录下,选中每一个jar文件(此处只有一个BaiduLbs_Android.jar)右键,选择Add As Library…
- 将assets/下的文件复制到项目对应文件夹下
3.编写java代码
- 将样例中两个库函数复制进来
3.1配置AndroidManifest.xml文件
-
在中添加如下权限声明,权限对应的代码均如下
-
<uses-permission android:name="android.permission.INTERNET" /> <uses-permission android:name="android.permission.RECORD_AUDIO" /> <uses-permission android:name="android.permission.CAMERA" /> <uses-permission android:name="android.permission.READ_PHONE_STATE" />
3.2 MainActivity.kt
-
package com.example.exp6; import android.app.AlertDialog; import android.os.Bundle; import android.os.Environment; import android.os.Handler; import android.os.Message; import android.util.Log; import android.view.View; import android.widget.Button; import android.widget.EditText; import android.widget.Toast; import androidx.activity.ComponentActivity; import com.iflytek.cloud.ErrorCode; import com.iflytek.cloud.InitListener; import com.iflytek.cloud.RecognizerListener; import com.iflytek.cloud.RecognizerResult; import com.iflytek.cloud.SpeechConstant; import com.iflytek.cloud.SpeechError; import com.iflytek.cloud.SpeechRecognizer; //import com.iflytek.cloud.SpeechUtility; import com.iflytek.cloud.SpeechUtility; import com.iflytek.cloud.ui.RecognizerDialog; import com.iflytek.cloud.ui.RecognizerDialogListener; import org.json.JSONException; import org.json.JSONObject; import java.util.ArrayList; import java.util.HashMap; import java.util.LinkedHashMap; public class MainActivity extends ComponentActivity implements View.OnClickListener { private static final String TAG = "MainActivity"; // 语音听写对象 private SpeechRecognizer mIat; // 语音听写UI private RecognizerDialog mIatDialog; // 用HashMap存储听写结果 private HashMap<String, String> mIatResults = new LinkedHashMap<>(); private EditText mResultText; private Button languageText, dialogButton; // 语言类型【默认中文】 private String language = "zh_cn"; // 格式类型【默认json】 private String resultType = "json"; private boolean cyclic = false;//音频流识别是否循环调用 //拼接字符串 private StringBuffer buffer = new StringBuffer(); //Handler码 private int handlerCode = 0x123; // 函数调用返回值 private int resultCode = 0; // 切换中英文 private boolean languageType; // 弹框是否显示 private int dialogType; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_main); SpeechUtility.createUtility(this, SpeechConstant.APPID +"=0e252bea"); //初始化控件 findViewById(R.id.iat_recognize).setOnClickListener(this); findViewById(R.id.iat_recognize_stream).setOnClickListener(this); findViewById(R.id.iat_stop).setOnClickListener(this); findViewById(R.id.iat_cancel).setOnClickListener(this); mResultText = this.findViewById(R.id.iat_text); // languageText = this.findViewById(R.id.languageText); // dialogButton = this.findViewById(R.id.dialogButton); // languageText.setOnClickListener(this); // dialogButton.setOnClickListener(this); // 初始化识别无UI识别对象 // 使用SpeechRecognizer对象,可根据回调消息自定义界面; mIat = SpeechRecognizer.createRecognizer(this, mInitListener); // 初始化听写Dialog,如果只使用有UI听写功能,无需创建SpeechRecognizer // 使用UI听写功能,请根据sdk文件目录下的notice.txt,放置布局文件和图片资源 mIatDialog = new RecognizerDialog(MainActivity.this, mInitListener); } @Override public void onClick(View view) { if (null == mIat) { // 创建单例失败,与 21001 错误为同样原因, // 参考 http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=9688 showToast("创建对象失败,请确认 libmsc.so 放置正确,且有调用 createUtility 进行初始化"); return; } switch (view.getId()) { // 开始听写 // 如何判断一次听写结束:OnResult isLast=true 或者 onError case R.id.iat_recognize: buffer.setLength(0);//长度清空 mResultText.setText(null);// 清空显示内容 mIatResults.clear();//清除存贮结果 // 设置参数 setParam(); if (dialogType == 0) { // 显示听写对话框 mIatDialog.setListener(mRecognizerDialogListener); mIatDialog.show(); showToast("开始听写"); } else if (dialogType == 1) { // 不显示听写对话框 resultCode = mIat.startListening(mRecognizerListener); if (resultCode != ErrorCode.SUCCESS) { showToast("听写失败,错误码:" + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案"); } else { showToast("开始听写"); } } else if (dialogType == 2) { // 自定义听写对话框 showAlertDialog(); resultCode = mIat.startListening(mRecognizerListener); if (resultCode != ErrorCode.SUCCESS) { showToast("听写失败,错误码:" + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案"); } else { showToast("开始听写"); } } break; // 音频流识别 case R.id.iat_recognize_stream: executeStream(); break; // case R.id.languageText: // if (languageType) { // languageType = false; // language = "zh_cn"; // languageText.setText("点击切换语种:中文"); // } else { // languageType = true; // language = "en_us"; // languageText.setText("点击切换语种:英文"); // } // mIat.setParameter(SpeechConstant.LANGUAGE, language); // break; // 停止听写 case R.id.iat_stop: mIat.stopListening(); showToast("停止听写"); break; // 取消听写 case R.id.iat_cancel: mIat.cancel(); showToast("取消听写"); break; // //默认显示弹框 // case R.id.dialogButton: // if (dialogType == 0) { // dialogType = 1; // dialogButton.setText("不显示讯飞弹框"); // } else if (dialogType == 1) { // dialogType = 2; // dialogButton.setText("显示自定义弹框"); // } else if (dialogType == 2) { // dialogButton.setText("显示讯飞弹框"); // dialogType = 0; // } // break; } } /** * 初始化监听器。 */ private InitListener mInitListener = new InitListener() { @Override public void onInit(int code) { Log.e(TAG, "SpeechRecognizer init() code = " + code); if (code != ErrorCode.SUCCESS) { showToast("初始化失败,错误码:" + code + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案"); } } }; /** * 听写监听器。 */ private RecognizerListener mRecognizerListener = new RecognizerListener() { @Override public void onBeginOfSpeech() { // 此回调表示:sdk内部录音机已经准备好了,用户可以开始语音输入 showToast("开始说话"); } @Override public void onError(SpeechError error) { // Tips: // 错误码:10118(您没有说话),可能是录音机权限被禁,需要提示用户打开应用的录音权限。 showToast(error.getPlainDescription(true)); if (null != dialog) { dialog.dismiss(); } } @Override public void onEndOfSpeech() { // 此回调表示:检测到了语音的尾端点,已经进入识别过程,不再接受语音输入 showToast("结束说话"); if (null != dialog) { dialog.dismiss(); } } @Override public void onResult(RecognizerResult results, boolean isLast) { Log.e(TAG, "onResult: " + results.getResultString()); if (resultType.equals(resultType)) { printResult(results); } else if (resultType.equals("plain")) { buffer.append(results.getResultString()); mResultText.setText(buffer.toString()); mResultText.setSelection(mResultText.length()); } if (isLast & cyclic) { // TODO 最后的结果 Message message = Message.obtain(); message.what = handlerCode; handler.sendMessageDelayed(message, 100); } } @Override public void onVolumeChanged(int volume, byte[] data) { //showToast("当前正在说话,音量大小:" + volume); Log.e(TAG, "onVolumeChanged: " + data.length); } @Override public void onEvent(int eventType, int arg1, int arg2, Bundle obj) { // 以下代码用于获取与云端的会话id,当业务出错时将会话id提供给技术支持人员,可用于查询会话日志,定位出错原因 // 若使用本地能力,会话id为null // if (SpeechEvent.EVENT_SESSION_ID == eventType) { // String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID); // Log.d(TAG, "session id =" + sid); // } } }; private Handler handler = new Handler() { @Override public void handleMessage(Message msg) { super.handleMessage(msg); if (msg.what == handlerCode) { executeStream(); } } }; /** * 听写UI监听器 */ private RecognizerDialogListener mRecognizerDialogListener = new RecognizerDialogListener() { /** * 识别回调成功 */ public void onResult(RecognizerResult results, boolean isLast) { printResult(results); } /** * 识别回调错误. */ public void onError(SpeechError error) { showToast(error.getPlainDescription(true)); } }; /** * 打印听写结果 */ private void printResult(RecognizerResult results) { String text = JsonParser.parseIatResult(results.getResultString()); String sn = null; // 读取json结果中的sn字段 try { JSONObject resultJson = new JSONObject(results.getResultString()); sn = resultJson.optString("sn"); } catch (JSONException e) { e.printStackTrace(); } mIatResults.put(sn, text); StringBuffer resultBuffer = new StringBuffer(); for (String key : mIatResults.keySet()) { resultBuffer.append(mIatResults.get(key)); } mResultText.setText(resultBuffer.toString()); mResultText.setSelection(mResultText.length()); } /** * 听写参数设置 */ public void setParam() { // 清空参数 mIat.setParameter(SpeechConstant.PARAMS, null); // 设置听写引擎类型 mIat.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); // 设置返回结果格式【目前支持json,xml以及plain 三种格式,其中plain为纯听写文本内容】 mIat.setParameter(SpeechConstant.RESULT_TYPE, resultType); //目前Android SDK支持zh_cn:中文、en_us:英文、ja_jp:日语、ko_kr:韩语、ru-ru:俄语、fr_fr:法语、es_es:西班牙语、 // 注:小语种若未授权无法使用会报错11200,可到控制台-语音听写(流式版)-方言/语种处添加试用或购买。 mIat.setParameter(SpeechConstant.LANGUAGE, language); // 设置语言区域、当前仅在LANGUAGE为简体中文时,支持方言选择,其他语言区域时,可把此参数值设为mandarin。 // 默认值:mandarin,其他方言参数可在控制台方言一栏查看。 mIat.setParameter(SpeechConstant.ACCENT, "mandarin"); //获取当前语言(同理set对应get方法) Log.e(TAG, "last language:" + mIat.getParameter(SpeechConstant.LANGUAGE)); //此处用于设置dialog中不显示错误码信息 //mIat.setParameter("view_tips_plain","false"); //开始录入音频后,音频后面部分最长静音时长,取值范围[0,10000ms],默认值5000ms mIat.setParameter(SpeechConstant.VAD_BOS, "5000"); // 设置语音后端点:后端点静音检测时间,即用户停止说话多长时间内即认为不再输入, 自动停止录音取值范围[0,10000ms],默认值1800ms。 mIat.setParameter(SpeechConstant.VAD_EOS, "1800"); // 设置标点符号,设置为"0"返回结果无标点,设置为"1"返回结果有标点 mIat.setParameter(SpeechConstant.ASR_PTT, "1"); // 设置音频保存路径,保存音频格式支持pcm、wav,设置路径为sd卡请注意WRITE_EXTERNAL_STORAGE权限 mIat.setParameter(SpeechConstant.AUDIO_FORMAT, "wav"); mIat.setParameter(SpeechConstant.ASR_AUDIO_PATH, Environment.getExternalStorageDirectory() + "/msc/helloword.wav"); } //执行音频流识别操作 private void executeStream() { buffer.setLength(0); mResultText.setText(null);// 清空显示内容 mIatResults.clear(); //设置参数 setParam(); //设置音频来源为外部文件 mIat.setParameter(SpeechConstant.AUDIO_SOURCE, "-1"); mIat.setParameter(SpeechConstant.LANGUAGE, language); //也可以像以下这样直接设置音频文件路径识别(要求设置文件在sdcard上的全路径): //mIat.setParameter(SpeechConstant.AUDIO_SOURCE, "-2"); //mIat.setParameter(SpeechConstant.ASR_SOURCE_PATH, "sdcard/XXX/XXX.pcm"); resultCode = mIat.startListening(mRecognizerListener); if (resultCode != ErrorCode.SUCCESS) { showToast("识别失败,错误码:" + resultCode + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案"); } else { byte[] audioData = FucUtil.readAudioFile(MainActivity.this, "iattest.wav"); if (null != audioData) { showToast("开始音频流识别"); // 一次(也可以分多次)写入音频文件数据,数据格式必须是采样率为8KHz或16KHz(本地识别只支持16K采样率,云端都支持),位长16bit,单声道的wav或者pcm // 写入8KHz采样的音频时,必须先调用setParameter(SpeechConstant.SAMPLE_RATE, "8000")设置正确的采样率 // 注:当音频过长,静音部分时长超过VAD_EOS将导致静音后面部分不能识别。 ArrayList<byte[]> bytes = FucUtil.splitBuffer(audioData, audioData.length, audioData.length / 3); for (int i = 0; i < bytes.size(); i++) { mIat.writeAudio(bytes.get(i), 0, bytes.get(i).length); try { Thread.sleep(1000);//休眠1秒 } catch (Exception e) { } } //mIat.writeAudio(audioData, 0, audioData.length ); mIat.stopListening(); } else { mIat.cancel(); showToast("读取音频流失败"); } } } @Override protected void onResume() { // 开放统计 移动数据统计分析 /*FlowerCollector.onResume(MainActivity.this); FlowerCollector.onPageStart(TAG);*/ super.onResume(); } @Override protected void onPause() { // 开放统计 移动数据统计分析 super.onPause(); } /** * 展示吐司 */ private void showToast(final String str) { Toast.makeText(this, str, Toast.LENGTH_SHORT).show(); } private AlertDialog dialog; private void showAlertDialog() { dialog = new AlertDialog.Builder(this) .setTitle("自定弹框")//标题 .setMessage("正在识别,请稍后...")//内容 .setIcon(R.mipmap.ic_launcher)//图标 .create(); dialog.show(); } }
3.3activity_main.xml布局代码
-
<?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:layout_width="match_parent" android:layout_height="match_parent" android:background="#519D9E" android:gravity="center_horizontal" android:orientation="vertical" android:paddingLeft="10dp" android:paddingRight="10dp"> <TextView android:layout_width="wrap_content" android:layout_height="wrap_content" android:layout_centerInParent="true" android:layout_margin="15dp" android:text="讯飞听写示例" android:textSize="30sp" /> <EditText android:id="@+id/iat_text" android:layout_width="match_parent" android:layout_height="0dp" android:layout_weight="1" android:gravity="top|left" android:hint="听写结果显示" android:paddingBottom="10dp" android:textColorHint="@color/white" android:textColor="@color/white" android:textSize="20sp" /> <LinearLayout android:layout_width="match_parent" android:layout_height="wrap_content" android:layout_marginTop="10dp" android:layout_marginBottom="2dp" android:gravity="center_horizontal" android:orientation="horizontal"> <Button android:id="@+id/iat_recognize" android:layout_width="0dp" android:layout_height="wrap_content" android:layout_weight="1" android:text="开始" android:textSize="20sp" /> <Button android:id="@+id/iat_stop" android:layout_width="0dp" android:layout_height="wrap_content" android:layout_weight="1" android:text="停止" android:textSize="20sp" /> <Button android:id="@+id/iat_cancel" android:layout_width="0dp" android:layout_height="wrap_content" android:layout_weight="1" android:text="取消" android:textSize="20sp" /> </LinearLayout> <!-- <Button--> <!-- android:id="@+id/dialogButton"--> <!-- android:layout_width="wrap_content"--> <!-- android:layout_height="wrap_content"--> <!-- android:text="显示讯飞弹框"--> <!-- android:textSize="20sp" />--> <!-- <Button--> <!-- android:id="@+id/languageText"--> <!-- android:layout_width="wrap_content"--> <!-- android:layout_height="wrap_content"--> <!-- android:text="点击切换语种:中文"--> <!-- android:textSize="20sp" />--> <Button android:id="@+id/iat_recognize_stream" android:layout_width="match_parent" android:layout_height="wrap_content" android:text="音频流识别" android:textSize="20sp" /> </LinearLayout>
4.运行与调试
- 运行程序,给予程序录音权限:
-
结果如下
5.学习中遇到的困难及解决
-
问题1:在初次运行代码时忘记修改主函数中项目id
问题1解决方案:修改后程序才能正常调用科大讯飞相关线上服务
-
问题2:运行程序后显示创建对象失败
问题2解决方案:通过参考同学的博客及老师实验书当中链接【官网】android 错误码21001, 21002, 20021, 创建单例返回 null,我了解到该问题是由于虚拟机架构为x86,与jnilibs中不一致。首先我尝试了使用上次实验的包,但由于两个SDK不一致,失败了;
之后经过同学提醒,我发现竟然AS能够支持arm64架构的虚拟机!赶快下载!
但又遇到了运行不了的问题:(无法解决
-
问题3:在使用老师代码时,出现case语句只能出现常量的报错
问题3解决方案:在gradle.properties配置文件下添加如下代码之后Sync一下,即可解决
android.nonFinalResIds=false
6.学习感悟、思考
- 本次实验没有百度地图顺利,通过几个无法避免的错误,我更加掌握了SDK及其内部的各种模块各种类的定义及使用方法。
- 实验中遇到了更多的问题,对于这些问题,更加考验我们对开发环境的熟悉和对文档的仔细阅读。本次实验在指导书和很多参考网站的指导下,我成功完成了一个漂亮的程序,非常令人开心!
参考资料
更多推荐
已为社区贡献2条内容
所有评论(0)