ICTCLAS(和jieba) 漢語詞性標注集
發(fā)布日期:2022/12/3 13:26:01 瀏覽量:
ICTCLAS (和jieba)漢語詞性標注集
漢語文本詞性標注標記集
Ag 形語素 形容詞性語素。形容詞代碼為a,語素代碼g前面置以A。
a 形容詞 取英語形容詞adjective的第1個字母。
ad 副形詞 直接作狀語的形容詞。形容詞代碼a和副詞代碼d并在一起。
an 名形詞 具有名詞功能的形容詞。形容詞代碼a和名詞代碼n并在一起。
b 區(qū)別詞 取漢字“別”的聲母。
c 連詞 取英語連詞conjunction的第1個字母。
Dg 副語素 副詞性語素。副詞代碼為d,語素代碼g前面置以D。
d 副詞 取adverb的第2個字母,因其第1個字母已用于形容詞。
e 嘆詞 取英語嘆詞exclamation的第1個字母。
f 方位詞 取漢字“方”
g 語素 絕大多數(shù)語素都能作為合成詞的“詞根”,取漢字“根”的聲母。
h 前接成分 取英語head的第1個字母。
i 成語 取英語成語idiom的第1個字母。
j 簡稱略語 取漢字“簡”的聲母。
k 后接成分
l 習(xí)用語 習(xí)用語尚未成為成語,有點“臨時性”,取“臨”的聲母。
m 數(shù)詞 取英語numeral的第3個字母,n,u已有他用。
Ng 名語素 名詞性語素。名詞代碼為n,語素代碼g前面置以N。
n 名詞 取英語名詞noun的第1個字母。
nr 人名 名詞代碼n和“人(ren)”的聲母并在一起。
ns 地名 名詞代碼n和處所詞代碼s并在一起。
nt 機構(gòu)團體 “團”的聲母為t,名詞代碼n和t并在一起。
nz 其他專名 “?!钡穆暷傅牡?個字母為z,名詞代碼n和z并在一起。
o 擬聲詞 取英語擬聲詞onomatopoeia的第1個字母。
p 介詞 取英語介詞prepositional的第1個字母。
q 量詞 取英語quantit的第1個字母。
r 代詞 取英語代詞pronoun的第2個字母,因p已用于介詞。
s 處所詞 取英語space的第1個字母。
Tg 時語素 時間詞性語素。時間詞代碼為t,在語素的代碼g前面置以T。
t 時間詞 取英語time的第1個字母。
u 助詞 取英語助詞auxiliary
Vg 動語素 動詞性語素。動詞代碼為v。在語素的代碼g前面置以V。
v 動詞 取英語動詞verb的第一個字母。
vd 副動詞 直接作狀語的動詞。動詞和副詞的代碼并在一起。
vn 名動詞 指具有名詞功能的動詞。動詞和名詞的代碼并在一起。
w 標點符號
x 非語素字 非語素字只是一個符號,字母x通常用于代表未知數(shù)、符號。
y 語氣詞 取漢字“語”的聲母。
z 狀態(tài)詞 取漢字“狀”的聲母的前一個字母。
-------------------------------------------------------------------------------
a: 形容詞
b: 區(qū)別詞
c: 連詞
d: 副詞
e: 嘆詞
g: 語素字
h: 前接成分
i: 習(xí)用語
j: 簡稱
k: 后接成分
m: 數(shù)詞
n: 普通名詞
nd: 方位名詞
nh: 人名
ni: 機構(gòu)名
nl: 處所名詞
ns: 地名
nt: 時間詞
nz: 其他專名
o: 擬聲詞
p: 介詞
q: 量詞
r: 代詞
u: 助詞
v: 動詞
wp: 標點符號
ws: 字符串
x: 非語素字
馬上咨詢: 如果您有業(yè)務(wù)方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生