最近幾個月在這個博客發了不少歌詞翻譯 似乎有要轉型成音樂博主的趨勢 ,前段時間買了個新域名 sak.uy ,準備專門用來放這些東方歌曲的歌詞翻譯,於是分設了單獨的博客「 Sakuya的音樂盒 」。主博客這邊右側邊欄會有到音樂盒的鏈接。

曾經在這邊的那些歌儘量保持 URL 跳轉過去,新的歌詞翻譯會發到那邊去,還想繼續聽歌的話請繼續訂閱那邊的 RSS 呀。

主博客這邊還是像往常一樣保持記錄生活點滴和技術經驗好了。說道介紹技術, 有人問過我那些日語歌詞上給漢字標註的假名都是我一個個手輸的麼? 一開始是手輸的,後來發現了不錯的自動化方案,於是這裏介紹一下。

首先是 python-furigana

這是個 python 寫的小程序(嚴格說是庫),可以把一段日文轉換成標準的 HTML 形式的 <ruby> 標籤的振假名( ()仮名(かな) )。 它本身只是個方便的格式化庫,實際工作是用 python-mecab 這個 binding 去查詢 mecab 這個著名的日語語料分析庫。要用它還得配合一些開源的 mecab 詞典,這些在 …

君さえいなけりゃよかった 如果你從未出現過該多好
降り出した雨の中で 君に出会った時から 下起雨的那一刻 從遇到你那時起
君がいないということが 当たり前じゃなくなった 身邊沒有你的情況 就已經不再是平常
ああ こんなはずじゃない 啊 不應該是這樣的
ずっと自分勝手にさ 過ごせたはずなのに 明明一直是散漫地過着自己的日子
まるで僕じゃないような僕が さらけ出されてくよ 就像是帶出了不是我的另一面的我

君さえいなけりゃよかった こんな気持ちは知らないから 如果你從未出現過該多好 就不會知道這種心情
やらなくちゃいけないことが 手つかずのまま積もってく 一堆不得不做的事情 堆在手頭越積越多
僕じゃなくてもいいのなら こっちを見て笑わないでよ 如果不是我也可以的話 就別看着我這邊笑啊
大袈裟じゃなくてそれだけで 忘れられなくなるの 甚至那些不重要的事情 都變得難以忘記了

君の適当な話も 全部心に刺さります 你無意間隨口說的話 全都刺在心頭
気にしなけりゃいいのにな 残らずかき集めちゃうの 雖說只要不在意就可以了 卻一句不剩全收集了起來
ああ こんなはずじゃない こんなはずじゃない 啊 不應該是這樣的 不應該是這樣的 …

我的 RSS 訂閱着一個博客叫 The Old New Thing ,作者是Windows開發者之一的 Raymond Chen ,記錄 Windows 中的很多有趣的技術細節。 這個博客中的一些精彩內容還被他寫成了一本書,中文名叫《Windows編程啓示錄》 (ISBN: 978-7-111-21919-4) 而英文書名就叫 The Old New Thing — Practical Development Throughout the Evolution of Windows (ISBN: 978-0-321-44030-3)。

今天看到這個博客的一篇文章說 你用「簡單地」次數越多我越懷疑你不懂這個詞的意思 , 描述他看到某個博客上指導讀者打開命令行、執行某條魔法命令、從命令輸出抽取參數、 改寫配置文件、用魔法命令重啓服務,並把這些工作描述爲「簡單地」。

的確正如 Raymond 指出,一個人覺得簡單的事情對別人並不一定是簡單的。 搜了一下我自己寫的東西,的確很多地方寫了「簡單 …

最近 mazk 說我 life 分類裏的文章太少 ,所以想了想寫了這篇。

很多人問過我爲什麼要來日本留學,嘛原因之一是我英語太差了,相對而言日語比較好。 另一方面,我比較喜歡日本的學術氛圍。這個當然是主觀體會,而不是客觀的評價,只是我 覺得相對於 歐美喜歡研究基礎架構技術日本則偏向實用層面

說個具體一點例子,最近看到這篇新聞說 卢布贬值影响中央气象台预报准确率? ,其中提到:

因为卢布贬值,天气预报的准确率会有所降低

也說道:

不过经我多年的观察,中国中央气象台的预报准确率实在是不怎么样,具体到我生活的地区, 实际天气状况和中国中央气象台预报的出入较大……

相信不少人也有類似的體會。

天氣預報是事關人們生活的重要信息,其準確度對生產生活當然有很大影響。 說到增加天氣預報的準確度,人們自然會想到高性能的超級計算機比如 天河二號 ,想到環繞在地球高空的 氣象衛星 ,想到遍佈世界各地的氣象站觀測臺。想想這麼多耗資不菲的高尖端項目被國家投入, 用來改善天氣預報的準確程度,看起來這的確是一個困難的科研課題。

話說回來,準確預測氣溫、氣壓、溼度、降水概率等等這些事情對於生產生活固然重要, 不過對一般民衆而言,天氣預報最重要的作用就只是回答 明天我該穿多厚的衣服,出門是否需要打傘 這種問題 …

June 6

Keynote 1

沒怎麼聽懂,只記得講到了finance is not money但是沒聽懂這個和軟件有什麼關係。

Cost Estimation for Distributed Software Project

講到他們試圖改善現有的模型去更精確地評估軟件開發的開銷。

他們會給PM建議之前的項目的歷史數據,然後對於新項目,他們建議歷史上已有 的項目的數據,從而幫助PM得到更精確的評估。他們試圖儘量減少項目評估對PM 的經驗的需求,從而幫助即使經驗很少的PM也能準確評估項目的開銷。

他們的觀點:

Context-specfic solutions needed!

我們需要更上下文相關的解決方案!

Early user paticipation is key!

早期用戶的參與是關鍵

Characterizing Logging Practices in Open-Source Software

Common mistakes in logging messages

在日誌記錄中容易犯的錯誤

他們學習了歷史上的log記錄,然後試圖找到重複修改的輸出log的語句,確定log …

Mining Software Repository 2012 @ ICSE

參加了今年的MSR,會場在University of Zurich。一大早來到大學,註冊有點 小插曲,顯然瑞士人搞不清楚中國人的名字,3個楊(Yang)姓的中國人的名牌 被搞錯了。然後堀田學長的所屬被寫作了“Japan, Japan”,成爲了全日本的代表。

MSR(MicroSoft Research) talk @ MSR(Mining Software Repositories)

首先是來自微軟亞洲研究院(MicroSoft Research @ Asia, MSR Asia)的Keynots, 於是就變成了MSR在MSR的演講。MSR的張冬梅(Dongmei Zhang)女士的演講 分爲關於Software Analysis和XIAO的兩部分。XIAO是MSRA開發的Code Clone Detector,似乎我要給井上研做的就是這個。想更多瞭解Xiao的細節,不過張女士 演講結束的時候的鼓掌導致了話筒的小故障 …