Python - 切片字符串



Python 字符串切片是一种从给定字符串创建子字符串的方法。在这个过程中,我们提取字符串的一部分或片段。通常,我们使用切片运算符 “[ : ]” 对 Python 字符串执行切片。在继续进行字符串切片之前,我们先了解一下字符串索引。

在 Python 中,字符串Unicode 字符的有序序列。字符串中的每个字符在序列中都有一个唯一的索引。索引从 0 开始。字符串中的第一个字符的位置索引为 0。索引在 string 的末尾不断递增。

如果字符串变量声明为 var=“HELLO PYTHON”,则字符串中每个字符的索引如下所示 -

string index representation

Python 字符串索引

Python 允许您通过索引访问字符串中的任何单个字符。在这种情况下,0 是字符串的下限,11 是字符串的上限。因此,var[0] 返回 H,var[6] 返回 P。如果方括号中的索引超过上限,Python 会引发 IndexError。

在下面的示例中,我们通过 index 访问字符串的字符。


var = "HELLO PYTHON"
print(var[0])	
print(var[7]) 	
print(var[11]) 	
print(var[12])	

在运行代码时,它将生成以下输出 -

H
Y
N
ERROR!
Traceback (most recent call last):
File "<main.py>", line 5, in <module>
IndexError: string index out of range

Python 字符串负索引和正索引

Python 序列类型(以及字符串对象)的独特功能之一是它也具有负索引方案。在上面的示例中,使用正索引方案,其中索引从左到右递增。在负索引的情况下,末尾的字符具有 -1 索引,索引从右到左递减,因此第一个字符 H 具有 -12 索引。

positive negative indexing

让我们使用负索引来获取 N、Y 和 H 字符。


var = "HELLO PYTHON"
print(var[-1])	
print(var[-5]) 	
print(var[-12]) 	

在执行上述代码时,它将给出以下结果 -

N
Y
H

因此,我们可以使用正索引或负索引从字符串中检索字符。

在 Python 中,string 是一个不可变的对象。如果对象一旦存储在某个内存位置,就无法就地修改,则该对象是不可变的。您可以借助其索引从字符串中检索任何字符,但不能将其替换为其他字符。

在以下示例中,字符 Y 位于 HELLO PYTHON 中的索引 7 处。尝试将 Y 替换为 y,看看会发生什么。


var="HELLO PYTHON"
var[7]="y"
print (var)

它将产生以下输出 -

Traceback (most recent call last):
File "C:\Users\users\example.py", line 2, in <module>
var[7]="y"
~~~^^^
TypeError: 'str' object does not support item assignment

TypeError 是因为字符串是不可变的。

Python 字符串切片

Python 将 “:” 定义为字符串切片运算符。它从原始字符串返回一个子字符串。它的一般用法如下 -


 substr=var[x:y]

“:” 运算符需要两个整数操作数(这两个操作数都可以省略,我们将在后面的示例中看到)。第一个操作数 x 是所需切片的第一个字符的索引。第二个操作数 y 是所需字符串中最后一个操作数旁边的字符的索引。因此 var(x:y) 将字符从原始字符串的第 x 位分隔到第 (y-1) 位。


var="HELLO PYTHON"

print ("var:",var)
print ("var[3:8]:", var[3:8])

它将产生以下输出 -

var: HELLO PYTHON
var[3:8]: LO PY

使用负索引的 Python 字符串切片

与正索引一样,负索引也可用于切片。

下面的示例演示如何使用负索引对字符串进行切片。


var="HELLO PYTHON"
print ("var:",var)
print ("var[3:8]:", var[3:8])
print ("var[-9:-4]:", var[-9:-4])

它将产生以下输出 -

var: HELLO PYTHON
var[3:8]: LO PY
var[-9:-4]: LO PY

使用字符串切片的索引的默认值

Python 的 Slice 运算符的两个操作数都是可选的。第一个操作数默认为零,这意味着如果我们不给出第一个操作数,则 slice 的字符从第 0 个索引开始,即第一个字符。它将最左侧的子字符串切片为 “y-1” 个字符。

在此示例中,我们将使用默认值执行切片操作。


var="HELLO PYTHON"
print ("var:",var)
print ("var[0:5]:", var[0:5])
print ("var[:5]:", var[:5])

它将产生以下输出 -

var: HELLO PYTHON
var[0:5]: HELLO
var[:5]: HELLO

同样,y 操作数也是可选的。默认情况下,它是 “-1”,这意味着字符串将从第 x 个位置到字符串的末尾进行切片。


var="HELLO PYTHON"
print ("var:",var)
print ("var[6:12]:", var[6:12])
print ("var[6:]:", var[6:])

它将产生以下输出 -

var: HELLO PYTHON
var[6:12]: PYTHON
var[6:]: PYTHON

当然,如果两个操作数都没有使用,则 slice 将等于原始字符串。这是因为 “x” 是 0,而 “y” 是默认的最后一个索引 + 1(或 -1)。


var="HELLO PYTHON"
print ("var:",var)
print ("var[0:12]:", var[0:12])
print ("var[:]:", var[:])

它将产生以下输出 -

var: HELLO PYTHON
var[0:12]: HELLO PYTHON
var[:]: HELLO PYTHON

左侧操作数必须小于右侧的操作数,才能获得原始字符串的子字符串。Python 不会引发任何错误,如果左操作数更大,则 bu 返回 null 字符串。


var="HELLO PYTHON"
print ("var:",var)
print ("var[-1:7]:", var[-1:7])
print ("var[7:0]:", var[7:0])

它将产生以下输出 -

var: HELLO PYTHON
var[-1:7]:
var[7:0]:

字符串切片的返回类型

切片返回一个新字符串。您可以很好地执行字符串操作,例如连接或对切片字符串进行切片。


var="HELLO PYTHON"

print ("var:",var)
print ("var[:6][:2]:", var[:6][:2])

var1=var[:6]
print ("slice:", var1)
print ("var1[:2]:", var1[:2])

它将产生以下输出 -

var: HELLO PYTHON
var[:6][:2]: HE
slice: HELLO
var1[:2]: HE