地球上每台电脑里都有他的贡献——缅怀无损压缩算法之父 Abraham Lempel
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
Abraham Lempel
Abraham Lempel(阿伯拉罕·莱姆佩尔)是以色列计算机科学家,因他与Jacob Ziv 一同提出的Lempel-Ziv压缩算法而闻名于世。Abraham Lempel于1936年出生于波兰,后来移民以色列,在以色列理工学院获得了博士学位,并留校担任电气工程和计算机科学教授,并在1981年至1984年期间担任 Taub 计算机科学学院院长。1993年,他受聘于惠普公司,一年后在以色列建立了第一家计算及实验室,直到2007年,该公司以他的名义在美国共注册了八项专利。
在1976年至1978年发表的三篇基础性论文中, Lempel和 Ziv 开发了一种被称为LZ77 的数据压缩算法,这是第一种使用字典数据的算法,因为其极高的压缩效率和无损特性,且无需事先了解数据的统计属性,被广泛应用于信息技术的各个领域,对于提高数据存储和数据传输的效率作出了重大贡献,从那时起,LZ算法及其衍生产品 成为使用最广泛的数据压缩方案。
无损数据压缩算法工作原理是,任何非随机文件都包含重复信息,这些信息可以通过使用统计建模技术来浓缩,从而确定字符或短语出现的概率。然后可以使用这些统计模型根据发生概率为特定字符或短语生成代码,并未最常见的数据分配最短的代码。这些技术包括熵编码法、游程编码和使用字典进行压缩。使用这些技术和其他技术,一个8位字符或这种字符的字符串可以用几位表示,从而删除大量冗余数据。
如果人们觉得在使用56K调制解调器上网、用500M硬盘存储的时代,数据的压缩很重要,而现在千兆光纤入户、1T硬盘标配的年代,压不压缩好像就不再重要了,这是很大的误解。根据2020年的不完全估计:
每天有10亿人打开微信,至少发布1亿条视频内容; 淘宝每天产生的数据量是50T; 推特发送5亿条推文; 发送2940亿封电子邮件; 在Facebook上创建了4 PB的数据,其中包含3.5亿的照片以及1亿小时的视频; 在WhatsApp上发送了650亿条消息; 可穿戴设备产生28PB的数据; Instagram 分享了9500万个照片和视频; 韦伯望远镜拍摄的照片一张都有几十G;
……
存储和传输技术虽然在不断发展,但是相比于人类制造大量“有的没的”数据的能力,怕是永远都不太够用。随着时间的推移,Lempel 的发明更加凸显出巨大的价值。
除了LZ77之外,Lempel还为多个领域的研究做出了重要贡献,包括字符串匹配、无损数据压缩、随机游走、算法信息理论等方面。1998年,他获得了由IEEE信息理论学会颁发的技术创新金禧奖以及2007年IEEE Richard W. Hamming奖,以表彰他在“数据压缩方面的开创性工作,特别是Lempel-Ziv算法”。
点击下方知社人才广场,查看最新学术招聘
扩展阅读
微信扫码关注该文公众号作者