一、背景
最近在项目中涉及到中英文翻译的功能需求,合情合理,所以肯定是要能支持到的!
二、技术选型
2.1、实现设想
自己写一个翻译软件肯定不太可行的(我也整不出来啊),肯定是找寻一个现有的解决方案哈。
2.2、目前市面上的翻译
目前来说,比较为人所熟知的翻译主要有:百度翻译、谷歌翻译、有道翻译、金山翻译…并且他们也都有对应的api支持的。
① 这里附上其相关的官方地址信息:https://fanyi.baidu.com/home、https://translate.google.cn/、https://ai.youdao.com/?keyfrom=old-openapi#/
② 其中百度翻译相关产品信息如下:
③ 有道翻译的产品相关信息如下:
2.3、最终选型
综合考虑,我这边选择百度翻译,只要看上标准版的免费哈!
PS: 像阿里云翻译啊这些其实和有道翻译是差不多的,是以资源包的形式来进行业务支持的。
三、接入流程
3.1、注册百度翻译平台
① 在接入百度翻译时需要有账号支持,像普通的账号注册一样,我们按照其操作说明注册账号即可。
② 选择服务,我这边选择的是通用翻译的标准版
③ 配置api服务信息,主要是配置服务器IP(在配置之外的IP上时无法使用接入api的)
④ 整体操作后,控制台如下:
3.2、接入须知
这里借用官方的一些文字说明(更为详尽的信息请进入官方平台查阅:https://fanyi-api.baidu.com/doc/21)通用翻译API通过HTTP接口对外提供多语种互译服务。您只需要通过调用通用翻译API,传入待翻译的内容,并指定要翻译的源语言(支持源语言语种自动检测)和目标语言种类,就可以得到相应的翻译结果。
通用翻译API HTTP地址:
http://api.fanyi.baidu.com/api/trans/vip/translate
通用翻译API HTTPS地址:
https://fanyi-api.baidu.com/api/trans/vip/translate
请求方式: 可使用GET或POST方式,如使用POST方式,Content-Type请指定为:application/x-www-form-urlencoded
字符编码:统一采用UTF-8编码格式
query长度:为保证翻译质量,请将单次请求长度控制在 6000 bytes以内。(汉字约为2000个)
3.3、核心代码部分
① 翻译工具类
public class TransUtil {
@Value("${baiduTranslate.appid}")
private String appid;
@Value("${baiduTranslate.securityKey}")
private String securityKey;
private static final String TRANS_API_HOST = "http://api.fanyi.baidu.com/api/trans/vip/translate";
public String getTransResult(String query, String from, String to) {
Map<String, String> params = buildParams(query, from, to);
return HttpClientUtil.doGet(TRANS_API_HOST, params);
}
private Map<String, String> buildParams(String query, String from, String to) {
Map<String, String> params = new HashMap<String, String>();
params.put("q", query);
params.put("from", from);
params.put("to", to);
params.put("appid", appid);
/* 随机数 */
String salt = String.valueOf(System.currentTimeMillis());
params.put("salt", salt);
/* 签名,加密前的原文 */
String src = appid + query + salt + securityKey;
params.put("sign", MD5.md5(src));
return params;
}
}
Java
② MD5工具类
public class MD5 {
/* 首先初始化一个字符数组,用来存放每个16进制字符 */
private static final char[] hexDigits = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd',
'e', 'f' };
/**
* 获得一个字符串的MD5值
*
* @param input 输入的字符串
* @return 输入字符串的MD5值
*
*/
public static String md5(String input) {
if (input == null){
return null;
}
try {
/* 拿到一个MD5转换器(如果想要SHA1参数换成”SHA1”) */
MessageDigest messageDigest = MessageDigest.getInstance("MD5");
/* 输入的字符串转换成字节数组 */
byte[] inputByteArray = new byte[0];
try {
inputByteArray = input.getBytes("utf-8");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
/* inputByteArray是输入字符串转换得到的字节数组 */
messageDigest.update(inputByteArray);
/* 转换并返回结果,也是字节数组,包含16个元素 */
byte[] resultByteArray = messageDigest.digest();
/* 字符数组转换成字符串返回 */
return byteArrayToHex(resultByteArray);
} catch (NoSuchAlgorithmException e) {
return null;
}
}
/**
* 获取文件的MD5值
*
* @param file
* @return
*/
public static String md5(File file) {
try {
if (!file.isFile()) {
System.err.println("文件" + file.getAbsolutePath() + "不存在或者不是文件");
return null;
}
FileInputStream in = new FileInputStream(file);
String result = md5(in);
in.close();
return result;
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
public static String md5(InputStream in) {
try {
MessageDigest messagedigest = MessageDigest.getInstance("MD5");
byte[] buffer = new byte[1024];
int read = 0;
while ((read = in.read(buffer)) != -1) {
messagedigest.update(buffer, 0, read);
}
in.close();
String result = byteArrayToHex(messagedigest.digest());
return result;
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
private static String byteArrayToHex(byte[] byteArray) {
/* new一个字符数组,这个就是用来组成结果字符串的(解释一下:一个byte是八位二进制,也就是2位十六进制字符(2的8次方等于16的2次方))*/
char[] resultCharArray = new char[byteArray.length * 2];
/* 遍历字节数组,通过位运算(位运算效率高),转换成字符放到字符数组中去 */
int index = 0;
for (byte b : byteArray) {
resultCharArray[index++] = hexDigits[b >>> 4 & 0xf];
resultCharArray[index++] = hexDigits[b & 0xf];
}
/* 字符数组组合成字符串返回 */
return new String(resultCharArray);
}
}
Java
3.4、测试结果
四、后记
其实搜索免费翻译平台api可以查出很多信息,也有平台支持到免费试用。我试了谷歌翻译和有道翻译的免费api,发现一个比较致命的问题,就是调用次数过多的时候会被限制(这是正常情况啦)。以谷歌翻译api为例,我在2s间隔的情况下调用六十多次就被限制了,有道翻译的api会好一些在2s间隔连续调用了170多次后还能使用。
我也曾想过多去轮询有道和谷歌翻译但是总归还是有限流的风险的,这对于一个线上项目是很不友好的!那这里有朋友可能会说,你现在的通用翻译标准版的QPS也只是1,一样有可能无法满足业务情况!那么针对这种情况我们其实可以多注册几个账号,然后轮询使用多个api哈,当然如果这时也不能满足了.那只能说你现在的业务量已经不能允许你白嫖了!老实注册一个高级版(每月还有200w的使用字符量的)。
本文来自离殇投稿,不代表胡巴网立场,如若转载,请注明出处:http://www.hu85.com/180307.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 xxxxx@qq.com 举报,一经查实,本站将立刻删除。