The Sun Also Rises
恍如隔世
FreePeter 发表于 2012-01-19 22:57:30
回家的时间总是短暂的
这段时间宁波总是下雨,
都没啥机会出去走走。
哎,扪心自问,这一年半都做了什么,学到了什么。
躁动与不安,静不下心来。
是一种完全迷失的感觉,曾经奉为圭臬的东西,一下子似乎轰然倒地。
倒也不是说变得一文不值,只是那种神圣的感觉不在了。。。
感觉曾经的自己如同堂吉诃德一般,
谁知道这不会是一件好事呢。
呃,其实我相信这是好事,这个年纪了,也改变的现实了吧。。。
只是,这个过程无疑是迷失而又痛苦的。。。
就像,就像原有的东西被彻底的瓦解了,
新的东西,连影子都没有~
随着阅历的增长,总会慢慢找到出路的吧。。。
就像,现在的我的思路,比1.5年前,还是长进了不少的。。。
虽然,还是不足以走出这个迷宫。。。
但是至少可以做一些local computation了吧(-,-b)
有时候会想起一些过去的事情,
怀旧么?
有些事情我们无法选择,当它到来的时候我们只有面对。
。。。
。。。
。。。
或者我们也可以选择。。。
。。。
种太阳~~
http://v.youku.com/v_show/id_XNTUzNjQ3MTY=.html
这段时间宁波总是下雨,
都没啥机会出去走走。
哎,扪心自问,这一年半都做了什么,学到了什么。
躁动与不安,静不下心来。
是一种完全迷失的感觉,曾经奉为圭臬的东西,一下子似乎轰然倒地。
倒也不是说变得一文不值,只是那种神圣的感觉不在了。。。
感觉曾经的自己如同堂吉诃德一般,
谁知道这不会是一件好事呢。
呃,其实我相信这是好事,这个年纪了,也改变的现实了吧。。。
只是,这个过程无疑是迷失而又痛苦的。。。
就像,就像原有的东西被彻底的瓦解了,
新的东西,连影子都没有~
随着阅历的增长,总会慢慢找到出路的吧。。。
就像,现在的我的思路,比1.5年前,还是长进了不少的。。。
虽然,还是不足以走出这个迷宫。。。
但是至少可以做一些local computation了吧(-,-b)
有时候会想起一些过去的事情,
怀旧么?
有些事情我们无法选择,当它到来的时候我们只有面对。
。。。
。。。
。。。
或者我们也可以选择。。。
。。。
种太阳~~
http://v.youku.com/v_show/id_XNTUzNjQ3MTY=.html
收藏:
QQ书签
del.icio.us
吐槽JG...
FreePeter 发表于 2011-08-16 07:12:41
meeting的时候JG说,啊,我没带paper啊,忘在家里了~
哇,原来JG童鞋周末还努力看paper啊。。。好感动。。。。吗?
JG说,啊,我其实没看过哦,你看了么,给我讲讲吧。。。
。。。。
你不看带回家个妹啊。。。。。~ 哄老婆孩子么@@@@
哇,原来JG童鞋周末还努力看paper啊。。。好感动。。。。吗?
JG说,啊,我其实没看过哦,你看了么,给我讲讲吧。。。
。。。。
你不看带回家个妹啊。。。。。~ 哄老婆孩子么@@@@
收藏:
QQ书签
del.icio.us
MBA们被b4了@@~
FreePeter 发表于 2011-07-18 08:17:02
网景公司当年完成了30亿美元的IPO,而这也后来被称为90年代泡沫的开始。您当年是否预测到泡沫将会如罗马帝国倒塌一样轰然破灭?
上世纪90年代的时候,几乎所有的MBA毕业生都想在硅谷创办科技公司,而大部分都是不具备条件的。是他们带来了这样的科技狂热和不靠谱的创业行为。所以说MBA毕业生的动向很能反应问题:如果他们都想涌入投行,那么金融危机正在形成;如果他们都想进行科技创业,那么科技泡沫正在产生。
收藏:
QQ书签
del.icio.us
看到一句话@@
FreePeter 发表于 2011-07-01 07:34:10
Codd made relations,
all else is the work of man
all else is the work of man
收藏:
QQ书签
del.icio.us
大家都啥都不知道,居然还能讨论1小时@@@
FreePeter 发表于 2011-06-08 23:04:22
我本来还以为今天就是一个quick sync呢~ 结果大家在那里扯蛋啊~
这个故事告诉我们, PhD扯蛋是很重要的~ 你看名字就叫"Ph蛋"
这个故事告诉我们, PhD扯蛋是很重要的~ 你看名字就叫"Ph蛋"
收藏:
QQ书签
del.icio.us
Structure Learning vs. Relational Learning
FreePeter 发表于 2011-06-02 07:40:52
貌似strcture learning是说,我们要预测的y现在不再是一个简单的label了,而是可以有着复杂internal strcture的东西。。。比如树,图,子集。。。@@; 但是每一个预测还是独立的; 本质上还是在求p(y | x), 只不过现在y可以很复杂。。。比如伟大的structured SVM就是做这个事情的
relational learning则是说,预测之间相互不独立; 比如ontology alignment里面,子节点align了说明父节点很有可能也会align; 貌似很多用处是在 information extraction里面? 不太清楚; 然后有一种做法是把first-order logic和statistical learning结合 (Markov Logic Network, PSL貌似也是这个思路,但是PSL的那个概率怎么看都觉得像凑的~ 也可能是我没理解); 不太清楚小麦是怎么用CRF来做relational learning 的,貌似1没用first-order logic...
顺便说一句,我怎么觉得小麦比JG还要有钱的样子。。。1各种DARPA/IAPRA的项目啊~
才疏学浅~ 有不对之处尽管拍砖~
relational learning则是说,预测之间相互不独立; 比如ontology alignment里面,子节点align了说明父节点很有可能也会align; 貌似很多用处是在 information extraction里面? 不太清楚; 然后有一种做法是把first-order logic和statistical learning结合 (Markov Logic Network, PSL貌似也是这个思路,但是PSL的那个概率怎么看都觉得像凑的~ 也可能是我没理解); 不太清楚小麦是怎么用CRF来做relational learning 的,貌似1没用first-order logic...
顺便说一句,我怎么觉得小麦比JG还要有钱的样子。。。1各种DARPA/IAPRA的项目啊~
才疏学浅~ 有不对之处尽管拍砖~
收藏:
QQ书签
del.icio.us
被python打败了~
FreePeter 发表于 2011-05-03 11:45:16
速度不是关键。关键是我没有办法预测他的速度。
好吧,具体一点,问题如下,
两个稀疏vector, x & y, 求 ||(x - y)||^2
方法1:用内建的dictionary,比如存储为{2:1, 10:1, 17:1}
方法2:用一个数组(list) of pairs (就是python里的tuple,按从小到大存储), 存储为 [(2, 1), (10, 1), (17, 1)] 计算的时候线性的扫描一下
(写成方法2纯属偶然,本来肯定是用dictionary写起来省事,但是构建vector的时候随手用了下zip(), 然后就自动生成了list of tuples,然后想,那干脆写个线性扫描吧)
现在的问题是。。。。
方法1比方法2要快。。。orz....
让我们更明确一点,
在我的机器上,方法1和方法2差不多快似乎(可能有一个快一些,但是没有很明显的感觉)。
但是扔到服务器上,方法2就莫名其妙的慢的一塌糊涂(比本地还慢)
----------------------------------------------------
具体我有空了再详细查;目前猜测的原因是tuple和list是在python interpreter level执行的,overhead比较大; 而dictionary很可能是直接调C-lib了,然后我们的应用中还是挺随机的,很可能hash一次命中。
anyway...实在是被打败了。。。我还是改用Java把。。Python还是用于快速prototype实现。。。(比如我上学期的无敌暴力kmeans,哇咔咔)
care效率的时候还是用java吧。。。然后继续复读机地表示scala赶紧一统江湖~~~简直是运行效率 + 开发效率的平衡点啊~~~
据说伟大的SVM light有Java interface, 我们假装很好用吧。。。嘿嘿嘿嘿嘿嘿嘿。。。
(某位thorsten的弟子啊,你怎么可以抛弃你老板的svm light改用libsvm呢,这样是不对的~~~,应该赶紧写一个SVM_active发布~~~)
----------------------------------------------------
另外python的内存overhead让我觉得有点恐怖啊。 data大概是500mb这样子; 然后跑的时候用掉了4G+...sigh...
好吧,具体一点,问题如下,
两个稀疏vector, x & y, 求 ||(x - y)||^2
方法1:用内建的dictionary,比如存储为{2:1, 10:1, 17:1}
方法2:用一个数组(list) of pairs (就是python里的tuple,按从小到大存储), 存储为 [(2, 1), (10, 1), (17, 1)] 计算的时候线性的扫描一下
(写成方法2纯属偶然,本来肯定是用dictionary写起来省事,但是构建vector的时候随手用了下zip(), 然后就自动生成了list of tuples,然后想,那干脆写个线性扫描吧)
现在的问题是。。。。
方法1比方法2要快。。。orz....
让我们更明确一点,
在我的机器上,方法1和方法2差不多快似乎(可能有一个快一些,但是没有很明显的感觉)。
但是扔到服务器上,方法2就莫名其妙的慢的一塌糊涂(比本地还慢)
----------------------------------------------------
具体我有空了再详细查;目前猜测的原因是tuple和list是在python interpreter level执行的,overhead比较大; 而dictionary很可能是直接调C-lib了,然后我们的应用中还是挺随机的,很可能hash一次命中。
anyway...实在是被打败了。。。我还是改用Java把。。Python还是用于快速prototype实现。。。(比如我上学期的无敌暴力kmeans,哇咔咔)
care效率的时候还是用java吧。。。然后继续复读机地表示scala赶紧一统江湖~~~简直是运行效率 + 开发效率的平衡点啊~~~
据说伟大的SVM light有Java interface, 我们假装很好用吧。。。嘿嘿嘿嘿嘿嘿嘿。。。
(某位thorsten的弟子啊,你怎么可以抛弃你老板的svm light改用libsvm呢,这样是不对的~~~,应该赶紧写一个SVM_active发布~~~)
----------------------------------------------------
另外python的内存overhead让我觉得有点恐怖啊。 data大概是500mb这样子; 然后跑的时候用掉了4G+...sigh...
收藏:
QQ书签
del.icio.us
IARPA真难缠 >_<
FreePeter 发表于 2011-04-22 23:22:55
JG快去拉点NSF的funding, 或者拉点德国政府或者欧洲的funding啊啊啊啊啊~
你看听说欧洲政府在Semantic Web上烧了好多好多钱。。。您老又是德国人,乘机骗funding啊。。。
这种没事干每周需求变更一次的项目最讨厌了。。。
你看听说欧洲政府在Semantic Web上烧了好多好多钱。。。您老又是德国人,乘机骗funding啊。。。
这种没事干每周需求变更一次的项目最讨厌了。。。
收藏:
QQ书签
del.icio.us
继续记录脚本。。。bash果然灵活的和什么一样@@@@@@@
FreePeter 发表于 2011-04-22 12:39:08
#! /bin/bash
for FILENAME in `ls ~/dataset/benchmarks/*/onto.rdf | grep /[1,3]`
do
DIRNAME=${FILENAME:0:${#FILENAME}-8}
echo $DIRNAME
NUM=`echo $DIRNAME | cut -d/ -f6`
cp $FILENAME dataset2/dataset2.rdf
cp $DIRNAME/refalign.rdf dataset2/refalign.rdf
./run.sh
cp owlalignments.txt "umd_result/align$NUM.txt"
done
----------------------------------
ls | awk -F'.' '{print "mv " ".rdf " ".txt"}' | bash
有空一定要研究一下awk, 太妖艳了。
------------------------------------
听说周一就可一拿到新版本的UMass Matcher了,期待!!!
for FILENAME in `ls ~/dataset/benchmarks/*/onto.rdf | grep /[1,3]`
do
DIRNAME=${FILENAME:0:${#FILENAME}-8}
echo $DIRNAME
NUM=`echo $DIRNAME | cut -d/ -f6`
cp $FILENAME dataset2/dataset2.rdf
cp $DIRNAME/refalign.rdf dataset2/refalign.rdf
./run.sh
cp owlalignments.txt "umd_result/align$NUM.txt"
done
----------------------------------
ls | awk -F'.' '{print "mv " ".rdf " ".txt"}' | bash
有空一定要研究一下awk, 太妖艳了。
------------------------------------
听说周一就可一拿到新版本的UMass Matcher了,期待!!!
收藏:
QQ书签
del.icio.us

