Python lzma 模块



Lempel-Ziv-马尔可夫链算法 (LZMA) 使用字典压缩方案执行无损数据压缩,该方案具有比其他压缩算法更高的压缩率。Python 的 lzma 模块由类和便捷函数组成,用于使用 LZMA 算法压缩和解压缩数据。

尽管此模块中的功能类似于 bz2 模块的功能,但与 BZ2File 类相比,LZMAFile 类不是线程安全的。

同样,lzma 模块中的 open() 函数是打开 lzma 压缩文件对象的非常简单的方法。

open() 函数

此函数将打开 LZMA 压缩的文件并返回文件对象。该函数需要两个主要参数 - 文件名和模式。mode 参数默认为 “rb”,但可以采用以下任何值 -

  • 二进制模式 − “r”、“rb”、“w”、“wb”、“x”、“x”、“xb”、“a” 或 “ab”
  • 文本模式 − “rt”、“wt”、“xt” 或 “at”

compress() 函数

此函数使用 LZMA 算法压缩给定数据并返回字节对象。此函数可以选择拥有决定容器格式的 format 参数。可能的值为 FORMAT_XZ (default) 和 FORMAT_ALONE。

decompress() 函数

此函数解压缩数据并返回未压缩的字节对象。

以下示例中使用了上述函数。要将 LZMA 压缩数据写入文件 -


import lzma
data=b"Welcome to qikepu"
f=lzma.open("test.xz","wb")
f.write(data)
f.close()

将在当前工作目录中创建一个 'test.xz' 文件。提取未压缩的数据 在此文件中使用以下代码 -


import lzma
f=lzma.open("test.xz","rb")
data=f.read()
print (data)
b'Welcome to qikepu'

要使用 lzma 模块的面向对象 API 执行压缩,我们必须使用 LZMAFile 类。

LZMAFile() 方法

这是 LZMAFile 类的构造函数。它需要指定 file 和 mode。具有 'w' 或 'wb' 模式的对象使 write() 方法对它可用。

write() 方法

该方法压缩给定的数据并将其写入其下面的文件中。


data=b'Welcome to qikepu'
obj=lzma.LZMAFile("test.xz", mode="wb")
obj.write(data)
obj.close()

使用 mode='rb' 参数创建的 LZMAFile 对象的 read() 方法读取压缩文件并检索未压缩的数据。

read() 函数

该方法从压缩文件中读取数据并返回未压缩的数据。


obj=lzma.LZMAFile("test.xz", mode="rb")
data=obj.read()
data
b'Welcome to qikepu'