茱莉亚·伊万斯

第16天:gzip+诗歌=很棒

Gzip通过将文本替换为指向文本前面部分的指针来压缩。下面是解压缩时实际发生的情况的可视化特雷文.它突出了原诗中抄袭的文本片段。

我今天在黑客学校的一个星期四的演讲中展示了这一点:)我真的很喜欢你如何看到诗歌内部的押韵,比如(敲击…敲击)在压缩算法中出现。

没有声音,只是GZIP。

如果你想要克隆,你可以试试。https://github.com/jvns/gzip.jl以及查看“可视化”分支。

编辑:感谢评论中的建议,这里是整首诗哈姆雷特.

编辑:一些澄清,对感兴趣的人:

我从零开始实现gunzip以了解它是如何工作的。这个可视化是除此之外的一个小型黑客,只是添加一些打印和睡眠语句。你可以看到源代码就是这样产生的。

这实际上显示了LZ77压缩是如何工作的,这是gzip(或DEFLATE)压缩的第一步。第二步是哈夫曼编码,完全没有显示在视频中:)。如果你想知道更多,试试这个精彩但很长的一页.