关于

这是我的个人站点,我常用的网名叫wentrue或Once,以下是我的爱好及行踪。

个人兴趣

  • 编程工具: Python/R/C是我常用的编程工具,跟web开发相关的语言与工具也有涉及。python是万能粘合剂,是我现在工作上的主要编程语言,进行web开放与搭建一些服务,本网站的主站就是用python+django写的。 R是一个数据统计与挖掘的平台,由S语言发展而来,但又不仅仅是一种语言。你可以使用它来写脚本,实现与S、SPSS、SAS相似的功能,你还可以在它的基础上编写自己的扩展,用C/C++/Fortran使得它的功能得到极大的增强,所以它是一个用于科学计算、统计数据分析的平台。我使用它强大的计算能力与无所不包的扩展来进行数据分析与计算,并把一些自己用C语言写的程序整合进这个平台来管理与使用
  • 数据管理: 我日常工作的一部分是数据分析与计算平台搭建,依据我的见解,现在智能技术的发展依赖于海量数据的管理与利用,所以数据库、数据仓库,是计算平台的基础部件,一个扎实的数据管理与分析平台是所有网络创意的源泉。在一个公司比较小、服务器比较少时,还不必要用到bigtable、hadoop这样的牛刀,但我对不同类型数据库,如关系型、文档型、列存储、key-value型数据库都有一定程度的涉猎,另外数据仓库方面对Infobright的使用也颇有心得
  • 推荐系统: 在现今这个富饶经济时代,信息是过载的,如何给个人推送更合适的信息,使人们获取信息的成本在搜索引擎之后继续降低,个性化推荐技术任重道远。在网络世界里,信息资源是大量的,注意力资源是稀缺的,所以,服务的重点已经不在于产生多少量的信息,而是把合适的信息分配给合适的人。最近readwriteweb撰文提出2009年五大网络趋势,其中就包含“个性化技术”。现在我的一个工作重点,也是在于推荐系统的开发与改进
  • 语义网: Readwriteweb撰文提出的2009年五大网络趋势,还包含网络数据的结构化。这些年来语义网一直是人们对网络的美好愿望,如果网络上那庞大的数据能为计算机所理解并产生可用的知识,这是多么激动人心的事情。然而纯粹统计计算的方法已经在语义理解方面已经很难再进一步,如何利用群体智能,如何在计算模型中融入人们贡献的智慧,是一个可行的前景。

网络行踪

  • 我在douban上: http://www.douban.com/people/wentrue/。我现在是豆瓣网的算法工程师,主管计算平台及推荐算法。
  • 我在twitter上: https:/twitter.com/wentrue,我算是个twitter的依赖性用户,日常大都通过twitter获得新知新闻,我的很多信息也通过twitter分享。虽然twitter被墙已久,但挡不住广大群众推之热情。
  • 我在flickr上: http://www.flickr.com/photos/wentrue/,。flickr很清爽简洁的界面,交互性很好,我用它来存储博客及一些技术活动图片,在博客上作外链,就省下不少流量了:-)