北大计算所词性标注集简表

2012-10-9 foooy other

    代码    名称        帮助记忆的诠释

    Ag      形语素      形容词性语素。形容词代码为a,语素代码g前面置以A。

    a       形容词      取英语形容词adjective的第1个字母。

    ad      副形词      直接作状语的形容词。形容词代码a和副词代码d并在一起。

    an      名形词      具有名词功能的形容词。形容词代码a和名词代码n并在一起。

    b       区别词      取汉字“别”的声母。

    c       连词        取英语连词conjunction的第1个字母。

    Dg      副语素      副词性语素。副词代码为d,语素代码g前面置以D。

    d       副词        取adverb的第2个字母,因其第1个字母已用于形容词。

    e       叹词        取英语叹词exclamation的第1个字母。

    f       方位词      取汉字“方” 的声母。

    g       语素        绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。

    h       前接成分    取英语head的第1个字母。

    i       成语        取英语成语idiom的第1个字母。

    j       简称略语    取汉字“简”的声母。

    k       后接成分

    l       习用语      习用语尚未成为成语,有点“临时性”,取“临”的声母。

    m       数词        取英语numeral的第3个字母,n,u已有他用。

    Ng      名语素      名词性语素。名词代码为n,语素代码g前面置以N。

    n       名词        取英语名词noun的第1个字母。

    nr      人名        名词代码n和“人(ren)”的声母并在一起。

    ns      地名        名词代码n和处所词代码s并在一起。

    nt      机构团体    “团”的声母为t,名词代码n和t并在一起。

    nz      其他专名    “专”的声母的第1个字母为z,名词代码n和z并在一起。 

    o       拟声词      取英语拟声词onomatopoeia的第1个字母。

    p       介词        取英语介词prepositional的第1个字母。

    q       量词        取英语quantity的第1个字母。

    r       代词        取英语代词pronoun的第2个字母,因p已用于介词。

    s       处所词      取英语space的第1个字母。

    Tg      时语素      时间词性语素。时间词代码为t,在语素的代码g前面置以T。

    t       时间词      取英语time的第1个字母。

    u       助词        取英语助词auxiliary 的第2个字母,因a已用于形容词。

    Vg      动语素      动词性语素。动词代码为v。在语素的代码g前面置以V。

    v       动词        取英语动词verb的第一个字母。

    vd      副动词      直接作状语的动词。动词和副词的代码并在一起。

    vn      名动词      指具有名词功能的动词。动词和名词的代码并在一起。

    w       标点符号   

    x       非语素字    非语素字只是一个符号,字母x通常用于代表未知数、符号。

    y       语气词      取汉字“语”的声母。

    z       状态词      取汉字“状”的声母的前一个字母。

评论(0) 浏览(49268)

......

2012-10-8 foooy 随笔

    来深圳整整7个月了,不管哪方面收获都不如预期。

    今天看到一个同事说“盼完十一盼过年,人总要有一个盼头”,接下来我要好好想想我的盼头。

    .

    .

    .

    .

    .

    .

    .

    .

    做错了决定,就应该付出代价。

    .    

    .

评论(0) 浏览(36490)

ucenter用户中心头像修改,不使用自带方法,不使用flash

2012-10-4 foooy PHP

     项目中用户中心用的是ucenter,需要直接把开放平台的用户图像保存到本系统,uc自带的uc_avatar方法无法满足需求,通过用SocketSniff对该flash上传图片抓包分析,该flash先把用户选择的图片上传到ucenter根目录的data/tmp目录下,然后返回地址,用户选择区域后,生成三张图片的16进制代码,post给ucenter,就完成了用户的图像保存。知道了原理,程序就好写了。

 

在项目目录中的uc_client文件夹中的client.php增加一个uc_avatar_code函数,作用是返回input
function uc_avatar_code($uid, $type = 'virtual', $returnhtml = 1){
	$uid = intval($uid);
	$uc_input = uc_api_input("uid=$uid");
	$input =str_replace('25', '', $uc_input);
	return $input;
}
项目是用thinkPHP开发,下面是主要代码,其中checkTitle为php判断文件类型中的方法,由于整个过程可能会比较耗时,修改用户图像放到后端消息队列处理,先把用户的在开放平台的用户图像,保存在Public/tmp/文件夹下,名为$uid的文件,没有扩展名,直接下载的,不处理是不知道扩展名的。保存图像只需要请求saveOpenFace方法,加上用户id,即可保存用户图像。
/*
	 * 保存开放平台用户图像到uc
	 * 
	 * @uid : 用户id
	 * */
	public function saveOpenFace(){
		$uid = intval($_GET['id']);
		$path = 'Public/tmp/';
		$local = $path.$uid;		
		$suffix = checkTitle($local);
		$file = $local.'.'.$suffix;
		rename($local,$file);
		import("ORG.Util.Image");
		import("ORG.Net.Snoopy");
		$Image = new Image();
		$Snoopy = new Snoopy();
		$imgB = $path.'b_'.$uid.'.'.$suffix;
		$imgM = $path.'m_'.$uid.'.'.$suffix;
		$imgS = $path.'s_'.$uid.'.'.$suffix;
		$Image->img2thumb($file,$imgB,200,200,1);
		$Image->img2thumb($file,$imgM,120,120,1);
		$Image->img2thumb($file,$imgS,48,48,1);
		$input = uc_avatar_code($uid);		
		$formvars["avatar1"] = $this->imgTo16Code($imgB);
		$formvars["avatar2"] = $this->imgTo16Code($imgM);
		$formvars["avatar3"] = $this->imgTo16Code($imgS);
		$action = C('UC_HOST').'/index.php?m=user&inajax=1&a=rectavatar&appid=1&input='.$input.'&avatartype=virtual';
		$Snoopy->submit($action,$formvars);
		unlink($file);
		unlink($imgB);
		unlink($imgM);
		unlink($imgS);
		echo true;	
	}
	/*
	 * 把图片转换成16进制
	 * @file : 文件路径
	 * */
	public function imgTo16Code($filename){
		$file = file_get_contents($filename);
		$code = strtoupper(bin2hex($file));
		return $code;
	}

 PS:由于用的消息队列,后端是程序提交,POST提交用的Snoopy,伪造HTTP_USER_AGENT老是不成功,而无法提交,暂时把验证注释了,有时间在看看,注释的文件为ucenter/model/base.php84行即//exit('Access denied for agent changed');

标签: ucenter用户头像 消息队列

评论(2) 浏览(36375)

Powered by emlog 鄂ICP备14000186号-1 sitemap