张晓东教授来访研究院,交流SSD应用
张教授的背景我就不多介绍了,有兴趣的自己去搜吧可以参考此链接,总之是让人很兴奋的一次交流。
这次交流之前,我大致准备了三个问题,不过基本都没有得到提问的机会,张教授就已经把这些问题都提到了:
- Hybrid SSD/HDD的意义?
- Firmware or Software? Open vs. Optimistic
- Challenge to fs and block drivers
下面我基本按照张教授介绍的顺序把这些我们关心的问题提到。
张教授和 Intel lab、NSF 都进行了合作,致力于改善 SSD 的应用,释放 SSD 的最大潜能,进而推进 SSD 的应用。下面是正文:
张教授介绍的第一项工作是使用一个用户态程序来通过读写特征匹配来判断 SSD 的内部结构,主要是SSD读写的并发程度,从而确定对 SSD 可以进行何种优化。这方面,主要是对 SSD 内部的读写并发程度的判定,从而最大限度的利用SSD的能力。在这方面,张教授还回答了我关于开放一部分 firmware 的功能给软件来完成的可能性,张教授的判断是,这方面如果可以开放给操作系统应该是最好的方案,这个工具也就没必要了,但是各个厂商出于利益考虑,短时间内不会公开这一架构。
张教授介绍的第二项工作是同时使用 SSD 和 HDD,提供最佳应用组合,项目名叫 Hystor,在 block layer入手,将 HDD/SSD 以统一界面呈现给上层,调度热/小数据存放在 SSD,将大数据存放于 HDD,利用其大块连续数据读写的优势。对于某厂商的 Hybrid 方式,张教授表示不看好其单纯将 SSD 应用为 HDD 的 Cache 的方式。对于张教授的使用方式,其中会存在根据应用情况,将数据在不同容器间进行迁移的可能性,感觉上这方面是仍然不太成熟的方面,似乎还在改进中。
张教授介绍的第三项工作大致是根据第一项工作,对SSD的使用进行优化,包括一些预取机制,可以在 iosched 层面进行并行化的优化,充分利用SSD内部的读写并行化特征,对很多典型应用的性能有数倍的提升,可见目前的SSD应用的性能潜力还是蛮大的。
来一些花絮:
- 张教授在我某同事一进门的时候就认出他来,他04年到访中科大时,我们这位同事还在中科大念书呢,张教授不仅记得他有拉丁舞绝技,甚至还记得他的名字,叫我们这些记不住人的晚辈情何以堪啊
- 张教授使用的SSD是Intel X-25E,不太常见的高端设备,不过刚好我手里也有几块,呵呵,可以借鉴很多参数啊;
- 张教授是我在工大的校友,呵呵,工大的牛人还是挺多的,并不罕见,不过主要集中在80年代初期,呵呵;
- 后来的交流中,张教授多次提到了吴峰光、Colyli等大牛,呵呵,和国内的开发者还是有很多交流的。
此外,有点遗憾的是当天晚上有好几个活要干,我没坚持到最后,六点多溜了,呵呵。
Update:感谢张教授授权介绍讲座内容,并指出一些被我遗漏的花絮。