Các hàm xử lý chuỗi trong Python

Một chuỗi có thể khai báo bằng dấu nháy đôi ” hoặc đơn ‘. Ví dụ các chuỗi sau:

str1

 =

 “Hello”

str2

 =

 ‘world’

Có thể truy xuất từng ký
tự trong một chuỗi theo hình thức index, ví dụ:

 str1[0]

 ,

 str1[1]

 …

Có thể sử dụng 3 dấu nháy (đôi hoặc đơn) để khai báo chuỗi trên nhiều dòng. Ví dụ:

paragraph

 =

 “””This is line 1

This is line 2

This is line 3″””

1. Nối chuỗi

Có thể tạo một chuỗi dài từ việc nối các chuỗi lại theo cú pháp:

str

 =

 str1

 +

 ”

 +

 str2

2. Trích xuất chuỗi con

Có thể tạo các chuỗi con
thông qua toán tử lấy khoản

[start:end]

 

(range). Mặc định

 start

 

là từ vị trí đầu chuỗi

(

0

)

 end

 

là đến vị trí cuối chuỗi.Vídụ

str

 =

 ‘Hello world’

print str[

0

:

4

(Hiển thị

 “Hell”

print str[:

4

(Hiển thị

 “Hell”

print str[

3

:]

(Hiển thị

 “rld”

print str[

6

:

3

(Hiển thị

 “wo”

3. Lấy độ dài của chuỗi

Sử dụng hàm

 len(…)

 

để trả về độ dài của chuỗi. Ví dụ:

count

 =

 len(

“Hello
world”

(count có giá trị

 11

4. Tìm & thay thế nội dung

Có thể tìm và thay thế
trong chuỗi bằng cách gọi phương thức

 replace(search,
replace[, max])

 

của một chuỗi. Ví

dụ:

str

 =

 ‘Hello world’

newstr

 =

 str.replace(

‘Hello’

,

 ‘Bye’

print newstr

(Sẽ hiển thị chuỗi

 “Bye world”

trên màn hình)

5. Tìm vị trí chuỗi con

Có thể tìm vị trí của
một chuỗi con trong chuỗi lớn bằng cách gọi phương thức

 find(str, beg=0

end=len(string))

 

. Bắt đầu là vị trí

 0

 ,

nếu không tìm ra thì

trả về

 -1

 .

Ví dụ

str

 =

 ‘Hello world’

print str.find(

‘world’

(hiển thị

 6

print str.find(

‘Bye’

)

;

(hiển thị

 –

1

Hàm

 find()

 

sẽ tìm
theo thứ tự từ trái qua phải của chuỗi,

tức là từ lần
xuất hiện đầu tiên. Có thể dùng hàm

 rfind()

để tìm theo vị trí từ cuối chuỗi về phía trước.

6. Tách chuỗi

Có thể tách chuỗi dựa
theo một chuỗi delimeter bằng cách gọi phương thức

 split(str=””, num=string.count(str))

Ví dụ:

str

 =

 ‘Hello world’

print str.split(

‘ ‘

(Trả về một mảng có

 2

 phần tử là

 2

 chuỗi

 “Hello”

“world”

)

Có thể sử dụng hàm

 splitlines()

 

để tách chuỗi theo từng hàng và loại bỏ ký tự NEWLINE.

7. Trim ký tự khoẳng trắng

Có thể loại bỏ các ký tự (mặc định là ký tự khoảng trắng) trước và sau một chuỗi, bằng cách gọi các phương thức sau:

strip([chars])

 

: loại bỏ trước và sau
chuỗi

lstrip([chars])

 

: loại bỏ phía trước
chuỗi

rstrip([chars])

 

: loại bỏ phía sau chuỗi

isnumeric()

 :

Kiểm tra một chuỗi có phải là chuỗi
số

lower()

 

:

Chuyển chuỗi hết thành
chữ thường

upper()

 :

Chuyển chuỗi hết thành
chữ HOA