Kiểu ký tự trong C++ (Character) | How Kteam

Dẫn nhập

Ở bài học kinh nghiệm trước, bạn đã nắm được 2 kiểu tài liệu cực kỳ quan trọng : SỐ NGUYÊN và SỐ CHẤM ĐỘNG TRONG C + + ( Integer, Floating point ), và đã biết được những kinh nghiệm tay nghề cũng như những lỗi thường gặp khi sử dụng nó .

Hôm nay, mình sẽ giới thiệu cho các bạn một kiểu dữ liệu khá quan trọng trong lập trình: Kiểu ký tự trong C++ (Character)

Nội dung:

Để đọc hiểu bài này tốt nhất các bạn nên có kiến thức cơ bản về các phần:

Trong bài ta sẽ cùng tìm hiểu và khám phá những yếu tố :

  • Tổng quan về kiểu ký tự (Character)
  • Khai báo, khởi tạo và gán giá trị một biến ký tự
  • In ký tự ra màn hình
  • In ký tự từ số nguyên và ngược lại (Casting)
  • Escape sequences
  • Newline ‘\n’ và std::endl
  • Dấu nháy đơn ‘K’ và dấu nháy kép “Kteam” trong C++

Tổng quan về kiểu ký tự (Character)

Ở bài học kinh nghiệm trước, bạn đã học về kiểu tài liệu số học Integer và Floating point, những kiểu này dùng để xử lý những bài toán trong chương trình, và tàng trữ nó. Một chương trình nếu chỉ hiển thị số thì người dùng có nhìn vào cũng không hiểu được, lúc này bạn sẽ cần những biến để tàng trữ ký tự, hay những câu thông tin cho người dùng. Để làm được điều đó, bạn cần học qua kiểu char trong C + + .

Kiểu ký tự trong C++ (Character)

Trong C + +, char là một kiểu tài liệu đặc biệt quan trọng, nó vừa là kiểu số nguyên, cũng vừa là kiểu ký tự. Do đó, kiểu char tuân thủ toàn bộ những quy tắc của 1 số ít nguyên thông thường ( + – * / … ) .

Một biến kiểu char sẽ có độ lớn 1 bytes (8 bits), dùng để lưu trữ một ký tự trong bảng mã ASCII như (a, b, c, … 1, 2, 3, …)

ASCII (American Standard Code for Information Interchange – Chuẩn mã trao đổi thông tin Hoa Kỳ) là bộ kí tự và bộ mã kí tự dựa trên bảng chữ cái La Tinh trong tiếng Anh. Bảng bên dưới mô tả đầy đủ ký tự ASCII:

Kiểu ký tự trong C++ (Character)

Kiểu ký tự trong C++ (Character)

Kiểu ký tự trong C++ (Character)

Có 2 loại ký tự trong bảng mã ASCII:

  • Ký tự không in được (ký tự điều kiển) có mã từ 0 -> 31 và 127 bao gồm các ký tự dùng để điều khiển hay dùng như: backspace (7), new line (10), escape (27), bell (7) …Có 2 loại ký tự trong bảng mã ASCII:
  • Ký tự in được có mã từ 32 -> 126 bao gồm các chữ cái (a, b, c, …), số (1, 2, 3, …), toán tử (+, -, …), dấu câu (~, {, ^ …)

Bảng mã ASCII chuẩn có 128 ký tự, bảng mã ASCII lan rộng ra có 255 ký tự .

Khai báo, khởi tạo và gán giá trị một biến ký tự

Để khai báo, khởi tạo và gán giá trị cho một biến kiểu ký tự trong C++, bạn sử dụng từ khóa char:

char ch1{ 'K' };// khởi tạo biến character với ký tự 'K' (mã ASCII 75)
char ch2{ 75 };	// khởi tạo biến character với mã ASCII 75 (ký tự 'K')
char ch3(75);	// khởi tạo biến character với mã ASCII 75 (ký tự 'K')
char ch4 = 'K';	// khởi tạo biến character với ký tự 'K' (mã ASCII 75)
char ch5;	// khai báo biến kiểu character
ch1 = 75;	// gán mã ASCII 75 (ký tự 'K') cho biến character
  • Chú ý 1 : Vì bản chất của kiểu char cũng là số nguyên, nên khi khởi tạo hoặc gán giá trị cho biến kiểu char, bạn hoàn toàn có thể dùng số nguyên (mã ASCII) hoặc ký tự.
char ch1{ 75 };	// mã ASCII 75 (ký tự 'K')
char ch2{ 'K' };	// ký tự 'K' (mã ASCII 75)
  • Chú ý 2 : Ký tự số nguyên không giống với mã ASCII số nguyên, bạn cần phân biệt điều này để tránh nhầm lẫn khi khởi tạo một biến character.

Hai cách khởi tạo bên dưới trọn vẹn khác nhau :

char ch1{ '7' };	// khởi tạo biến character với ký tự '7' (mã ASCII 55)
char ch2{ 7 };	// khởi tạo biến character với mã ASCII 7 (tiếng “beep”)

In ký tự ra màn hình

Dù khi khởi tạo hoặc gán giá trị cho biến kiểu char, bạn hoàn toàn có thể dùng số nguyên (mã ASCII) hoặc ký tự. Nhưng khi in ra màn hình, nó hiển thị một ký tự ASCII thay vì một số nguyên.

#include 
using namespace std;

int main()
{
	char ch1{ 75 };	// mã ASCII 75 (ký tự 'K') 
cout << ch1 << endl;	// ký tự 'K' với mã ASCII 75 được hiển thị ra màn hình

char ch2{ 'K' };	// ký tự 'K' (mã ASCII 75)
cout << ch2 << endl;	// ký tự 'K' trực tiếp được hiển thị ra màn hình
	return 0;
}

Ở chương trình trên, 2 biến ch1, ch2 đều cho kết quả ‘K’ như nhau:

Kiểu ký tự trong C++ (Character)

In ký tự từ số nguyên và ngược lại (Casting)

char là một kiểu dữ liệu đặc biệt, nó vừa là kiểu số nguyên, cũng vừa là kiểu ký tự. Đồng nghĩa với việc bạn có thể in ra màn hình ký tự hoặc mã ASCII của nó:

#include 
#include 	// for std::setprecision()
using namespace std;

int main()
{
	int n{ 75 };
	cout << static_cast(n) << endl; // in ký tự với mã ASCII 75

	char ch{ 'K' };
	cout << static_cast(ch) << endl; // in mã ASCII của ký tự 'K'
	return 0;
}

Outputs:

Kiểu ký tự trong C++ (Character)

Chương trình trên sử dụng kỹ thuật ép kiểu static cast trong C++ để in một ký tự từ một số nguyên và ngược lại. Cú pháp ép kiểu static cast:

static_cast(expression)

Lệnh static cast sẽ chuyển đổi giá trị của expression thành một giá trị có kiểu Type-id (char, int, double, …), và trả về giá trị đó.

  • Chú ý 1 : Bản thân expression sẽ không bị ảnh hưởng sau khi ép kiểu (n vẫn là 75, ch vẫn là ‘K’).
  • Chú ý 2 : Khi bạn ép kiểu từ int sang char, nếu giá trị int của bạn lớn hơn giới hạn kiểu char, vấn đề tràn số sẽ xảy ra.

Phạm vi bài học kinh nghiệm này chỉ đề cập cơ bản về ép kiểu và static_cast, yếu tố này sẽ được trình làng chi tiết cụ thể hơn ở bài : ÉP KIỂU TƯỜNG MINH TRONG C + + ( Explicit type conversion )

Escape sequences

Trong C++, có một số ký tự mang ý nghĩa đặc biệt dùng trong chuỗi hay mảng ký tự gọi là Escape sequence. Một escape sequence có cấu trúc gồm một dấu ‘\’ (backslash), sau đó là một ký tự hoặc một số.

Bảng bên dưới liệt kê những Escape sequence trong C + + :

Kiểu ký tự trong C++ (Character)

Một số ví dụ về escape sequence thường gặp:

std::cout << "Howkteam.com\nFree Education"; // '\n' di chuyển con trỏ xuống một dòng mới

Outputs:

 Kiểu ký tự trong C++ (Character)

std::cout << "Tab 1\tTab 2 "; // '\t' di chuyển con trỏ 1 tab

Outputs:

Kiểu ký tự trong C++ (Character)

Vẫn còn rất nhiều escape sequence, bạn hãy tự mình tò mò nhé .

Newline ‘\n’ và std::endl

Ở những bài học trước, bạn sử dụng std::endl để xuống dòng khi in một chuỗi, nhưng sau khi học về Escape sequence, bạn lại biết thêm một cách để xuống dòng nữa là sử dụng escape sequence ‘\n’.

Nếu bạn viết một chương trình như bên dưới và sử dụng cả 2 cách, bạn sẽ có được tác dụng như nhau :

std::cout << "HowKteam.com" << std::endl;
std::cout << "Free education\n";

Tuy nhiên, 2 cách này có thực sự giống nhau? Câu trả lời là không, bản chất của std::endl được thể hiện ở 2 câu lệnh bên dưới:

std::cout << "HowKteam.com" << std::endl;

// Tương đương với:

std::cout << "HowKteam.com\n" << std::flush;

Trong C++, output stream thường dùng buffer, nghĩa là output data sẽ được lưu vào một vùng nhớ đệm, và output data sẽ được gửi đến output device vào thời điểm thích hợp (vì lý do hiệu suất). Với std::endl sẽ xóa output buffer mỗi khi nó được gọi, trong khi ‘\n’ thì không.

Vậy, khi nào nên sử dụng std::endl‘\n’:

  • Nên sử dụng std::endl khi bạn cần đảm bảo output của bạn có ngay lập tức (Vd: khi viết một record vào một file, hoặc khi update một thanh tiến trình). Nhưng nên hạn chế sử dụng std::endl khi làm việc với file I/O để tránh việc phải flush buffer liên tục dẫn đến việc phải truy cập các file I/O thường xuyên (giảm hiệu suất).
  • Ngoài ra, những trường hợp khác nên sử dụng ‘\n’.

Dấu nháy đơn ‘K’ và dấu nháy kép “Kteam”

Trong suốt bài học này, bạn có thể thấy các character luôn được đặt trong dấu nháy đơn (Vd: ‘K’, ‘t’, ‘e’, ‘a’, ‘m’). Một biến kiểu char sẽ lưu một ký tự, nếu bạn khởi tạo nhiều hơn 1 ký tự thì sẽ nhận được một thông báo lỗi như câu lệnh bên dưới:

char ch{ 'Kteam' };      // Câu lệnh này sẽ cho ra một thông báo lỗi

Những ký tự đặt trong dấu nháy kép gọi là một chuỗi ký tự (Vd: “HowKteam.com”), chuỗi ký tự là một tập hợp của các ký tự được đặt trong dấu nháy kép. Câu lệnh bên dưới thể hiện “HowKteam.com” là một chuỗi ký tự (string).

std::cout << "HowKteam.com";      // HowKteam.com là một chuỗi ký tự

Phạm vi bài học kinh nghiệm này chỉ đề cập đến ký tự, chuỗi ký tự ( string ) là tương đối phức tạp. Mình sẽ ra mắt về chuỗi ký tự ( string ) trong bài CHUỔI KÝ TỰ TRONG C + + ( String ) .

Kết luận

Qua bài học kinh nghiệm này, bạn đã nắm được Kiểu ký tự trong C + + ( Character ), và đã biết được những kinh nghiệm tay nghề cũng như vướng mắc tương quan đến kiểu ký tự khi sử dụng nó .

Trong C++, ngoài kiểu integer, floating point, character, thì vẫn còn một kiểu dữ liệu cực kỳ quan trọng. Bạn sẽ được học nó trong bài học tiếp theo: KIỂU LUẬN LÝ TRONG C++ (Boolean)

Cảm ơn các bạn đã theo dõi bài viết. Hãy để lại bình luận hoặc góp ý của mình để phát triển bài viết tốt hơn. Đừng quên “Luyện tập – Thử thách – Không ngại khó”.

Thảo luận

Nếu bạn có bất kể khó khăn vất vả hay vướng mắc gì về khóa học, đừng ngần ngại đặt câu hỏi trong phần bên dưới hoặc trong mục HỎI và ĐÁP trên thư viện Howkteam. com để nhận được sự tương hỗ từ hội đồng .