最近几个月在这个博客发了不少歌词翻译 似乎有要转型成音乐博主的趋势 ,前段时间买了个新域名 sak.uy ,准备专门用来放这些东方歌曲的歌词翻译,于是分设了单独的博客「 Sakuya的音乐盒 」。主博客这边右侧边栏会有到音乐盒的链接。

曾经在这边的那些歌尽量保持 URL 跳转过去,新的歌词翻译会发到那边去,还想继续听歌的话请继续订阅那边的 RSS 呀。

主博客这边还是像往常一样保持记录生活点滴和技术经验好了。说道介绍技术, 有人问过我那些日语歌词上给汉字标注的假名都是我一个个手输的么? 一开始是手输的,后来发现了不错的自动化方案,于是这里介绍一下。

首先是 python-furigana

这是个 python 写的小程序(严格说是库),可以把一段日文转换成标准的 HTML 形式的 <ruby> 标签的振假名( ()仮名(かな) )。 它本身只是个方便的格式化库,实际工作是用 python-mecab 这个 binding 去查询 mecab 这个著名的日语语料分析库。要用它还得配合一些开源的 mecab 词典,这些在 …

君さえいなけりゃよかった 如果你从未出现过该多好
降り出した雨の中で 君に出会った时から 下起雨的那一刻 从遇到你那时起
君がいないということが 当たり前じゃなくなった 身边没有你的情况 就已经不再是平常
ああ こんなはずじゃない 啊 不应该是这样的
ずっと自分胜手にさ 过ごせたはずなのに 明明一直是散漫地过着自己的日子
まるで仆じゃないような仆が さらけ出されてくよ 就像是带出了不是我的另一面的我

君さえいなけりゃよかった こんな気持ちは知らないから 如果你从未出现过该多好 就不会知道这种心情
やらなくちゃいけないことが 手つかずのまま积もってく 一堆不得不做的事情 堆在手头越积越多
仆じゃなくてもいいのなら こっちを见て笑わないでよ 如果不是我也可以的话 就别看着我这边笑啊
大袈裟じゃなくてそれだけで 忘れられなくなるの 甚至那些不重要的事情 都变得难以忘记了

君の适当な话も 全部心に刺さります 你无意间随口说的话 全都刺在心头
気にしなけりゃいいのにな 残らずかき集めちゃうの 虽说只要不在意就可以了 却一句不剩全收集了起来
ああ こんなはずじゃない こんなはずじゃない 啊 不应该是这样的 不应该是这样的 …

我的 RSS 订阅着一个博客叫 The Old New Thing ,作者是Windows开发者之一的 Raymond Chen ,记录 Windows 中的很多有趣的技术细节。 这个博客中的一些精彩内容还被他写成了一本书,中文名叫《Windows编程启示录》 (ISBN: 978-7-111-21919-4) 而英文书名就叫 The Old New Thing — Practical Development Throughout the Evolution of Windows (ISBN: 978-0-321-44030-3)。

今天看到这个博客的一篇文章说 你用「简单地」次数越多我越怀疑你不懂这个词的意思 , 描述他看到某个博客上指导读者打开命令行、执行某条魔法命令、从命令输出抽取参数、 改写配置文件、用魔法命令重启服务,并把这些工作描述为「简单地」。

的确正如 Raymond 指出,一个人觉得简单的事情对别人并不一定是简单的。 搜了一下我自己写的东西,的确很多地方写了「简单 …

最近 mazk 说我 life 分类里的文章太少 ,所以想了想写了这篇。

很多人问过我为什么要来日本留学,嘛原因之一是我英语太差了,相对而言日语比较好。 另一方面,我比较喜欢日本的学术氛围。这个当然是主观体会,而不是客观的评价,只是我 觉得相对于 欧美喜欢研究基础架构技术日本则偏向实用层面

说个具体一点例子,最近看到这篇新闻说 卢布贬值影响中央气象台预报准确率? ,其中提到:

因为卢布贬值,天气预报的准确率会有所降低

也说道:

不过经我多年的观察,中国中央气象台的预报准确率实在是不怎么样,具体到我生活的地区, 实际天气状况和中国中央气象台预报的出入较大……

相信不少人也有类似的体会。

天气预报是事关人们生活的重要信息,其准确度对生产生活当然有很大影响。 说到增加天气预报的准确度,人们自然会想到高性能的超级计算机比如 天河二号 ,想到环绕在地球高空的 气象卫星 ,想到遍布世界各地的气象站观测台。想想这么多耗资不菲的高尖端项目被国家投入, 用来改善天气预报的准确程度,看起来这的确是一个困难的科研课题。

话说回来,准确预测气温、气压、湿度、降水概率等等这些事情对于生产生活固然重要, 不过对一般民众而言,天气预报最重要的作用就只是回答 明天我该穿多厚的衣服,出门是否需要打伞 这种问题 …

渲染的样子
嫁给我好么

可以玩的是下面这个:

* 用 WASD←→ 移动,需要 WebGL 支持

June 6

Keynote 1

没怎么听懂,只记得讲到了finance is not money但是没听懂这个和软件有什么关系。

Cost Estimation for Distributed Software Project

讲到他们试图改善现有的模型去更精确地评估软件开发的开销。

他们会给PM建议之前的项目的历史数据,然后对于新项目,他们建议历史上已有 的项目的数据,从而帮助PM得到更精确的评估。他们试图尽量减少项目评估对PM 的经验的需求,从而帮助即使经验很少的PM也能准确评估项目的开销。

他们的观点:

Context-specfic solutions needed!

我们需要更上下文相关的解决方案!

Early user paticipation is key!

早期用户的参与是关键

Characterizing Logging Practices in Open-Source Software

Common mistakes in logging messages

在日志记录中容易犯的错误

他们学习了历史上的log记录,然后试图找到重复修改的输出log的语句,确定log …

Mining Software Repository 2012 @ ICSE

参加了今年的MSR,会场在University of Zurich。一大早来到大学,注册有点 小插曲,显然瑞士人搞不清楚中国人的名字,3个杨(Yang)姓的中国人的名牌 被搞错了。然后堀田学长的所属被写作了“Japan, Japan”,成为了全日本的代表。

MSR(MicroSoft Research) talk @ MSR(Mining Software Repositories)

首先是来自微软亚洲研究院(MicroSoft Research @ Asia, MSR Asia)的Keynots, 于是就变成了MSR在MSR的演讲。MSR的张冬梅(Dongmei Zhang)女士的演讲 分为关于Software Analysis和XIAO的两部分。XIAO是MSRA开发的Code Clone Detector,似乎我要给井上研做的就是这个。想更多了解Xiao的细节,不过张女士 演讲结束的时候的鼓掌导致了话筒的小故障 …