shortA-转写规范及标准
一、介绍
1. 使用谷歌浏览器,判断有效无效、选择属性、转写文本,需要贴着截取不需要预留。
a) 地址:http://123.56.137.109:5600/
b) 账号:LY-shortA
c) 任务:shortA-李静
2. 登录成功后,同意保密协议,就进入工作页面开始工作;
1) 判断声音是否有效:
有效:普通话/不标准的普通话,语音是标注中需要处理的有效语音
无效:典型举例如下(视具体音频随时补充无效原因)人工合成的声音无效唱歌无效
n 无法听清音频中的内容,噪音过大,分辨不了文本内容
n 方言,如:粤语、上海话、闽南语等,非汉语的发音如日语
n 两人说话,可以分清主要说话人,把另一人声音作为背景音,正常转写主要说话人,需要无效情况如下:
u 重叠了,分不清主次,无效
u 都听不清不确定说的是什么,无效
u 多人说话一前一后的对话,无效
n 无人说话;整条音频只有一个字的无效
n 音频中全部都是歌曲、电视声等人工合成的电子音
n 一半人工合成的电子音,一半人的发音。整条无效
n 一句话中有2个或者以上的字听不懂无效
2) 性别:男|女(如果出现无法辨别的中性声音,标注为女)
3) 口音:有|无(有:每个字发音都不标准。无:个别字不分平翘舌,个别字音不准不算口音)
4) 儿童:是|否(明显儿童,奶声奶气幼儿和明显的10岁以下青少年的稚嫩的声音)
5) 文本:分包后是按照音频时长排句子号的,所以会有连续相同的句子发音文本一致的情况,直接从前一句复制到下一句即可(连续多句的文本相同不是问题的句子是正常的)
快捷键:
无效:Alt+1;男Alt+2;女Alt+3;有口音Alt+4;无口音Alt+5;是儿童Alt+6;否Alt+7
二、文本标注规范及标准
1. 转写内容与实际发音内容一致,对于因为口音或者个人习惯导致的音变,仍按照原内容转写。Liu2奶→写牛奶;转写内容的完整性要与实际发音一致。轻微口音不改字
2. 标点:不加标点,可以写i’m ,don’t @转写为at
3. 数字写法:按照数字的汉字写法写成“一二三…”形式,而不是“123”更不能是“壹贰叁”;注意: 读yao1写幺,读lia3写俩,读liang3写两,读1.5*1.8写一点五乘以一点八
4. 英文:全部小写
a) 字母拼读小写加空格:q q;k t v;m p三 切记:务必字母拼读加空格
b) 单词小写,单词单词间加空格。如:“播放rolling in the deep”
5. 专有名词,人名和地名可以搜索到的歌名要写对。
6. 儿化音:一律不写儿化音。爸爸去哪er→爸爸去哪
但是发音有“儿”的要写出,比如:幼儿园,那些花儿…
7. 语气词: 音频中说话人清楚地讲出的语气词,如 “呃 啊 嗯 哦 唉 诶”等,要按照正确发音进行转写。
8. 切音情况:切音的字听的清可以准确判断出来,正常转写,并且截取进红线
切音的字听不清,需要靠猜测,这样的不要转写,且这个切音的字不要截取进红线
9. 保存:保存继续下一句快捷键(alt + enter),最后一句保存后,右上角出现提交按钮,提交后质检才能查标注员的任务。
10. 出现能确定发音,无法确定字形的情况,如果是歌名、专有名词、地名等,需要百度搜索写准确; 如果搜索不到,用同音字代替(同音字发音和音调都要和音频完全相同)
11. 一句话中一个字听不懂可以使用标签~代替(≥2个字听不懂,直接无效)
三、截取规范
1. 截取的区间音频必须与文本一致。贴着音频截取,从开始发音的点截取到结束发音的时间点。
2. 不要切到发音的字,不要有预留。
3. 前/后切音的字可以确认就截取进来,且转写
4. 前/后切音的字需要猜测出来,就不要截取进红线中,也不转写
四、标签:
{~}:代替不确定的或者听不懂的1个字,一条音频≥2个字听不懂,直接无效
五、注意事项
a) 需要截取,不用预留,不要切到字。
b) 超时回收:正常任务24小时(返工待修改任务48小时)后的凌晨3:07回收;
返工超3次,第4次返工系统回收
c) 新人第一个包做完提交后必须申请质检,首包通过后才可以自己随便领任务了
d) 音频 中有多人的语音重叠则无效,如果他人说话作为背景噪音的正常有效转写。一前一后说话也无效
e) 文本必须准确不确定要百度,实在百度不到的才能写同音同调(同音同调的字少用)
f) 只有1个字没有意义的语音无效
g) 一段音频有≥2个字听不懂的,直接无效
五、返工任务查看方式
a) 看到自己有返工的人,先查看返工意见看质检检查到哪句了比如检查到30句;进入该任务界面,先点击右上角的“质检情况”看具体条目的质检的反馈结果
b) 改好全部有反馈结果的条目后刷新界面,这样就能看到150句全部的条目,然后跳转到第31句自检,改好质检反馈的条目和31-150后可以再次提交给质检
六、数据审核标准和工资结算
申请的数据尽量在24小时之内完成,超时系统会自动回收。
每个任务包在质检通过之后,都会显示出具体的有效时长
工资=有效毫秒/1000/3600*单价