Kiểu dữ liệu string trong Javascript

Kiểu dữ liệu string trong JavaScript dùng để lưu trữ giá trị dạng text. Và không có kiểu dữ liệu đặc biệt nào cho một ký tự.

Kiểu dữ liệu string trong Javascript

ba loại kí tự dùng để biểu diễn string trong JavaScript là: dấu nháy đơn, dấu nháy kép và dấu “backtick”, ví dụ:

let

singleQuote = " hello "; let doubleQuote = " hello "; let backticks =

`hello`

;

Trong đó, dấu nháy đơn và dấu nháy kép hoàn toàn tương đương. Còn dấu “backtick” thì khác hơn. Dấu “backtick” cho phép bạn viết biểu thức hoặc gọi hàm bên trong ${...}, ví dụ:

function add(

a, b

) { return a + b; } console.log(

`Sum of 1 and 2 is

USD {add(1, 2)}

`

);

Ứng dụng khác của dấu ” backtick ” là được cho phép bạn viết string trên nhiều dòng :

let userList = 

`Users : + Alex + John + Anna`

; console.log(userList);

Nếu viết string trên nhiều dòng với dấu nháy đơn hoặc dấu nháy kép theo cách tương tự thì bạn sẽ bị lỗi:

let userList = "Users:
    + Alex
    + John
    + Anna
    ";

     

Biểu diễn kí tự đặc biệt

Thực tế, bạn vẫn có thể biểu diễn string trên nhiều dòng với dấu nháy đơn hoặc dấu nháy kép bằng cách sử dụng kí tự newline \n:

let userList = " Users : \ n + Alex \ n + John \ n + Anna ";

console.log(userList);

 

Kí tự \n là một kí tự đặc biệt, có nghĩa là newline (dòng mới).

Sau đây là tổng hợp một số ít kí tự đặc biệt quan trọng :

  • \n: dòng mới
  • \r: hệ điều hành Windows sử dụng tổ hợp \r\n để thể hiện xuống dòng. Trong khi các hệ điều hành khác Windows chỉ sử dụng kí tự \n.
  • \' hoặc \": dấu nháy đơn hoặc dấu nháy kép.
  • \\: dấu backslash.
  • \t: dấu tab.
  • \xXX: biểu diễn kí tự unicode, trong đó XX là mã unicode ở hệ thập lục phân. Ví dụ: \x7A tương đương với z.
  • \uXXXX: biểu diễn symbol unicode, trong đó XXXX là mã unicode ở hệ thập lục phân của symbol với UTF-16. Ví dụ: \u00A9 tương đương với biểu tượng copyright ©.
  • \u{X..XXX} (từ 1 đến 6 kí tự): biểu diễn symbol unicode, trong đó X..XXX là mã unicode ở hệ thập lục phân của symbol với UTF-32.

Một vài ví dụ với unicode :

console.log(" \ u00A9 ");  
console.log(" \ u { 20331 } ");  
console.log(" \ u { 1F60 D } ");  

Tất cả các kí tự đặc biệt đều bắt đầu bằng kí tự \.

Ví dụ sử dụng dấu nháy đơn trong string :

console.log(" I'm a js dev ");  

Dĩ nhiên, bạn có thể kết hợp các dấu nháy với nhau để tránh sử dụng kí tự \:

console.log(" I'm a js dev ");  

Với cách viết này, string trở nên rõ ràng và trực quan hơn rất nhiều .

Độ dài string trong JavaScript

Để lấy độ dài của string trong JavaScript, bạn sử dụng thuộc tính length:

console.log(

`Me \ n`

.length);

Kí tự \n là kí tự đặc biệt. Nên string Me\n chỉ có độ dài bằng 3, chứ không phải bằng 4.

length là thuộc tính chứ không phải phương thức. Vì vậy, nếu bạn gọi "str".length() thì sẽ bị lỗi “str “.length is not a function.

Truy cập các kí tự của string trong JavaScript

Để lấy giá trị của kí tự ở vị trí position trong string, bạn có thể dùng str[position] hoặc str.charAt(position) (vị trí bắt đầu là 0):

let str = " hello ";

 
console.log(str[0]);  

 
console.log(str[str.length - 1]);  

Cách sử dụng [] là cách mới, trong khi cách dùng charAt là một cách cũ.

Điểm khác nhau giữa hai cách này là: nếu không tìm thấy vị trí position thì [position] trả về undefined, còn charAt(position) trả về string rỗng.

let str = " hello ";

console.log(str[1000]);  
console.log(str.charAt(1000));  

Để duyệt hết những kí tự trong string, bạn hoàn toàn có thể dùng vòng lặp for thông thường :

let str = " hello ";

for (let i = 0; i < str.length; i+ +) {
  console.log(str[i]);
}

Kết quả :

h
e
l
l
o

Hoặc sử dụng vòng lặp for...of để ngắn gọn hơn:

let str = " hello ";

for (let c of str) {
  console.log(c);
}

String trong JavaScript là bất biến

String trong JavaScript là bất biến vì bạn không thể thay đổi kí tự trong string.

let str = " hello ";
str[0] = " H ";
console.log(str);  

Để giải quyết vấn đề này, bạn bắt buộc phải tạo một string mới.

Sau đây, mình sẽ tìm hiểu và khám phá kỹ hơn về bài toán này .

Thay đổi chữ hoa và thường

Có 1 số ít phương pháp giúp biến hóa chữ hoa và chữ thường của string trong JavaScript .

Phương thức toLowerCase() trả về string mới với tất cả các kí tự đều viết thường:

console.log(" Hello ".toLowerCase());  

Phương thức toUpperCase() trả về string mới với tất cả các kí tự đều viết hoa:

console.log(" Hello ".toUpperCase());  

Tìm kiếm substring

Có nhiều cách để tìm kiếm substring ( string con ) trong một string .

► Phương thức str.indexOf(substr, pos):

Phương thức này tìm kiếm substr bên trong string str bắt đầu từ vị trí pos. Kết quả trả về là vị trí của substring (vị trí kí tự đầu tiên) nếu tìm thấy, ngược lại thì trả về -1, ví dụ:

let str = " I am a js dev ";

console.log(str.indexOf(" js "));  
console.log(str.indexOf(" JS "));  
console.log(str.indexOf(" a "));  

Tham số thứ hai pos cho phép bạn xác định vị trí bắt đầu tìm kiếm:

let str = " I am a js dev ";
console.log(str.indexOf(" a ", 3));  

Nếu bạn muốn tìm tất cả vị trí của substring, bạn có thể sử dụng vòng lặp. Khi tìm thấy một vị trí, bạn lưu lại ví trí đó để sử dụng cho lần lặp tiếp theo. Cho đến khi kết quả là -1 thì dừng lại.

let str = " I am a js dev ";
let target = " a ";

let pos = 0;
while (true) {
  let foundPos = str.indexOf(target, pos);
  if (foundPos = = = -1) break;

  console.log(" found pos : ", foundPos);
  pos = foundPos + 1;
}

► Phương thức str.lastIndexOf(substr, pos)

Tương tự như phương thức str.indexOf(substr, pos) nhưng thực hiện tìm kiếm từ cuối lên đầu, ví dụ:

let str = " I am a js dev ";
console.log(str.lastIndexOf(" a "));  

► Phương thức str.includes(substr, pos)

Phương thức này cũng tìm substr trong str, nhưng thay vì trả về vị trí thì phương thức này trả về true nếu tìm thấy và trả về false nếu không tìm thấy.

Phương thức này đặc biệt quan trọng hữu dụng khi bạn cần kiểm tra tính sống sót của substring mà không quan tâm vị trí :

let str = " I am a js dev ";
console.log(str.includes(" js "));  
console.log(str.includes(" JS "));  

Tham số thứ hai pos cho phép bạn kiểm tra tính tồn tại bắt đầu từ vị trí pos:

let str = " I am a js dev ";
console.log(str.includes(" js ", 1)

)

; console.log(str.includes(" js ", 9));

► Phương thức str.startsWith(substr)

Trả về true nếu str bắt đầu bằng substr, ngược lại trả về false.

let str = " I am a js dev ";
console.log(str.startsWith(" I am "));  
console.log(str.startsWith(" js "));  

► Phương thức str.endsWith(substr)

Trả về true nếu str kết thúc bằng substr, ngược lại trả về false.

let str = " I am a js dev ";
console.log(str.endsWith(" I am "));  
console.log(str.endsWith(" dev "));  

Lấy giá trị substring trong string

ba phương thức để lấy giá trị substring của string trong JavaScript.

► Phương thức str.slice(start [, end])

Trả về substring bắt đầu từ vị trí start đến vị trí end (không bao gồm vị trí endstart luôn phải nhỏ hơn end), ví dụ:

let str = " I am a js dev ";
console.log(str.slice(2, 4));  

Nếu không truyền vào giá trị end thì phương thức này sẽ lấy đến cuối string:

let str = " I am a js dev ";
console.log(str.slice(2));  

Trường hợp giá trị của startend là số âm thì vị trí được đếm từ cuối lên đầu (vị trí cuối cùng ứng với -1):

let str = " I am a js dev ";
console.log(str.slice(-3, -1));  

► Phương thức str.substring(start [, end])

Trả về substring trong string giữa vị trí start và vị trí end (không bao gồm vị trí end).

Phương thức này gần giống phương thức str.slice(start, [, end]) chỉ khác ở chỗ là: phương thức substring cho phép start có thể lớn hơn endsubstring không áp dụng được cho trường hợp start, end có giá trị âm, ví dụ:

let str = " I am a js dev ";

 
console.log(str.substring(2, 4));  

 
console.log(str.substring(2));  

 
console.log(str.substring(4, 2));  

► Phương thức str.substr(start [, length])

Trả về substring bắt đầu từ vị trí start và lấy số kí tự là length.

let str = " I am a js dev ";
console.log(str.substr(2, 2));  

Trường hợp không có giá trị length thì trả về đến string:

let str = " I am a js dev ";
console.log(str.substr(2));  

Nếu giá trị start là âm, thì việc lấy substring được tính từ cuối (vị trí kí tự cuối cùng là -1):

let str = " I am a js dev ";
console.log(str.substr(-2, 2));  

💡 Trong ba phương thức trên thì phương thức slice có vẻ linh động hơn cả, vì nó ngắn gọn, dễ nhớ và hỗ trợ tham số âm.

Phương thức substr thì đã bị lỗi thời.

So sánh string trong JavaScript

So sánh string thực hiện so sánh từng kí tự từ trái sang phải. Và khi so sánh string, bạn thấy rằng kí tự viết thường lớn hơn kí tự viết hoa, ví dụ:

console.log(" a " > " A ");  

Tại sao lại như vậy?

Vì string trong JavaScript được encode bằng UTF-16. Nghĩa là mỗi kí tự tương ứng với 1 số ít .
Sau đây là những phương pháp giúp bạn quy đổi string sang số unicode và ngược lại .

► Phương thức str.codePointAt(pos)

Trả về mã code (số) tương ứng với kí tự tại vị trí pos, ví dụ:

console.log(" a ".codePointAt(0));  
console.log(" A ".codePointAt(0));  

Bạn thấy rằng mã code ứng với "a" (bằng 97) lớn hơn của "A" (bằng 65).

► Phương thức String.fromCodePoint(code)

Trả về kí tự ứng với mã code, ví dụ :

console.log(String.fromCodePoint(97));  
console.log(String.fromCodePoint(65));  

Bạn cũng có thể sử dụng mã Unicode bằng cách thêm kí tự \u trước mã hexa:

console.log(" \ u0061 ");  
console.log(" \ u0041 ");  

Thực tế, việc so sánh string phức tạp hơn nhiều vì nó còn nhờ vào vào ngôn từ vùng miền .
Ví dụ so sánh tiếng việt :

let str1 = " Thành Phố Hải Dương ";
let str2 = " Hòa Bình ";

console.log(str1 > str2);  

Theo ví dụ trên, kết quả str1 > str2 bằng true. Nghĩa là str1 lớn hơn str2.

Nhưng theo thực tế khi sắp xếp Tiếng Việt, chữ cái a bao giờ cũng đứng trước chữ cái o. Nói cách khác Hải Dương phải nhỏ hơn Hòa Bình.

Để giải quyết vấn đề này, bạn có thể dùng phương thức localeCompare.

Đối với str1.localeCompare(str2), có ba trường hợp xảy ra là:

  • Nếu kết quả trả về nhỏ hơn 0 thì str1 nhỏ hơn str2.
  • Nếu kết quả trả về lớn hơn 0 thì str1 lớn hơn str2.
  • Nếu kết quả trả về bằng 0 thì str1 bằng str2.

Áp dụng localeCompare với ví dụ trên:

let str1 = " Thành Phố Hải Dương ";
let str2 = " Hòa Bình ";

console.log(str1.localeCompare(str2));  

Kết quả là -1 (nhỏ hơn 0). Nói cách khác, str1 nhỏ hơn str2.

Tổng kết

Sau đây là những kiến thức và kỹ năng cơ bản về string trong JavaScript :

  • ba loại kí tự dùng để biểu diễn string trong JavaScript là: nháy đơn, nháy kép và "backtick".
" hello ";  
" hello ";  

`hello`

;
  • String trong JavaScript được encode bởi mã UTF-16.
  • Bạn có thể sử dụng kí tự đặc biệt trong string bằng cách thêm kí tự \ phía trước.
  • Để truy cập vào kí tự ở vị trí pos trong string, bạn có thể dùng str[pos] hoặc str.charAt(pos).
  • Để trả về string gồm các kí tự viết thường (hoặc viết hoa), bạn dùng str.toLowerCase (hoặc str.toUpperCase).
  • Để lấy substring, bạn sử dụng slice hoặc substring.
  • Để tìm kiếm substring trong string, bạn dùng indexOf.
  • Để kiểm tra tính tồn tại của substring, bạn sử dụng includes, startsWith hoặc endsWith.
  • Để so sánh string dựa trên đặc trưng ngôn ngữ vùng miền, bạn có thể dùng localeCompare. Nếu so sánh string bình thường thì kết quả chỉ dựa trên mã unicode tương ứng.

Ngoài ra, string còn nhiều phương pháp khác nữa. Bạn hoàn toàn có thể tìm hiểu thêm thêm tại :

Thực hành

Bài 1

Viết hàm upperFirst(str) nhận vào tham số là string str và trả về string mới với kí tự đầu tiên được viết hoa, ví dụ:

let s = upperFirst(" hello ");
console.log(s);  

Xem đáp án

 
function upperFirst(str) {
   
  if (!str) return str;

  return str[0].toUpperCase() + str.slice(1);
}

let s = upperFirst(" hello ");
console.log(s);  

Bài 2

Viết hàm extractMoney(value) nhận vào value là string biểu diễn tiền với đơn vị đô la $ ở đầu (ví dụ "$1000") và trả về số tiền (ví dụ 1000).

Xem đáp án

 
function extractMoney(str) {
  if (!str) return 0;

  return +str.slice(1);
}

let money = extractMoney(" USD 1000 ");
console.

log

Xem thêm: Java nâng cao

(money);