加入收藏 | 设为首页听说365不好提现?
 38365365
语音标记的一部分
发布时间:2019-05-09 点击:
4
10个部分的演讲
一些话语用于解释故事在语境中的作用。
例如,解释概念的单词称为名词,引用以下名词的单词称为代词。
某些词性有一些新词,如名词。这部分词性被称为词性的开放词部分。
换句话说,就像代词一样,词性词汇是相对固定的。这个词的这一部分被称为单词的封闭部分。
正确地标记单词的一部分并不像单词对应于词性的一部分那样容易。
例如,改革是中国计划经济体制改革初期的动词,这是医疗保健和健康改革的经济问题。
总结这个问题,一个众所周知的一系列单词,每个单词都有一个词性。
不同的语言具有不同的语音部分标签集。
例如,像我一样,英语中有一个反身代词,但在中文中没有反身代词。
可以对每个词性进行编码以便于语音部分的指定。
例如,在人注释的每日语料库PFR中,形容词被编码为a,名词被编码为n,并且动词被编码为v。
一些音频标签具有少量标签和大量标签。
例如,一些注释可以将代词分类为类别,并且大量注释可以进一步将代词分类为三个类别。
人称代词:你,我,他,你,我们,那些。
疑问代词:这是什么?
表演代词:这些是。
使用少量标签更容易,但是一组太小的标签会导致识别类型不佳。
例如,在黑白世界中,可以通过颜色深度来区分对象,但是可以通过彩色颜色来区分许多其他对象。
如表4-4所示,参考编码表中每日注释人PFR语音的一部分。
表4-4语音编码表的各个部分

上一篇:谈论人工繁殖。     下一篇:没有了