Data type là gì? Tại sao chúng lại quan trọng?

Data type được xem là nền tảng trong hầu hết, thậm chí còn hoàn toàn có thể nói là tổng thể những ngôn từ lập trình. Các kiểu dữ liệu được gán cho những giá trị nhằm mục đích bảo vệ những công dụng không bị lỗi và tương thích của dữ liệu đó .

Data Type là gì?

Data type, Kiểu dữ liệu, là một cách phân loại dữ liệu cho hệ thống máy tính biết cách diễn giải giá trị của nó. Việc hiểu các loại dữ liệu sẽ đảm bảo dữ liệu được thu thập ở định dạng ưa chuộng và giá trị mong đợi của từng thuộc tính.

Ví dụ, data type của “ Ross, Bob ” sẽ giúp máy tính vấn đáp thắc mắc :

  • Liệu dữ liệu có đề cập đến tên đầy đủ của ai đó (“Bob Ross”)
  • Hay đây là danh sách gồm hai tên (“Bob” và “Ross”)

Qua đó, giúp bạn đảm bảo rằng:

  • Dữ liệu bạn thu thập luôn ở định dạng phù hợp (“Ross, Bob” chứ không phải “Bob Ross”)
  • Giá trị mong đợi (“Ross, Bob” chứ không phải “R0$$, B0b”)

Lưu ý : Bạn không nên nhầm lẫn data type với customer data ( dữ liệu người mua ), tên gọi chung của entity data ( dữ liệu tổ chức triển khai ) và sự kiện data ( dữ liệu sự kiện ). Để xác lập đúng thuộc tính sự kiện và thuộc tính tổ chức triển khai, bạn cần hiểu rõ về data type. Kế hoạch theo dõi được xác lập rõ ràng phải chứa data type của mọi thuộc tính để bảo vệ độ đúng chuẩn và ngăn ngừa mất dữ liệu .
type04-1670498240.png
Data type là một cách phân loại dữ liệu cho hệ thống máy tính biết cách diễn giải giá trị của nó.

Data type phổ biến

Số nguyên (int)

Đây là kiểu dữ liệu số thông dụng nhất, chứa những số không có thành phần phân số. Ví dụ : – 707, 0, 707

Số thực dấu phẩy động (floating point)

Floating point là kiểu dữ liệu số dùng để tàng trữ những số hoàn toàn có thể có thành phần phân số giống như những giá trị tiền tệ. Ví dụ : 707.07, 0.7, 707.00

Ký tự (char)

Ký tự là vần âm, chữ số, dấu chấm câu, ký hiệu hoặc khoảng trống. Ví dụ a, 1, !

Chuỗi (str hoặc văn bản)

Đây là một dãy những ký tự và kiểu dữ liệu được sử dụng phổ cập nhất trong tàng trữ văn bản. Ngoài ra, một chuỗi cũng hoàn toàn có thể gồm có những chữ số và ký hiệu, tuy nhiên, nhìn chung nó được coi là văn bản .
Số điện thoại thông minh thường được lưu dưới dạng chuỗi ( + 1-999 – 666 – 3333 ) nhưng cũng hoàn toàn có thể được lưu dưới dạng số nguyên ( 9996663333 ) .

Boolean (bool)

Boolean đại diện thay mặt cho những giá trị đúng và sai, nhiều lúc một giá trị boolean cũng được bộc lộ bằng 0 ( so với sai ) và 1 ( so với đúng ) .

Kiểu liệt kê (enum)

Enumerated type là một tập hợp những giá trị hoàn toàn có thể có của 1 thuộc tính. Ví dụ về Giới tính thì hoàn toàn có thể có Nam, Nữ, Gay, Less. Tình trạng hôn nhân gia đình của 1 người thì hoàn toàn có thể là Độc thân, Đã đính hôn, Phức tạp, Đã kết hôn .
Kiểu dữ liệu mặc định của Enum là số nguyên, trong đó thành phần tiên phong sẽ có giá trị là 0 và những thành phần tiếp theo mặc định tăng lên 1. Ví dụ : giá trị đại diện thay mặt cho Độc thân là 0, Đã đính hôn là 1, Phức tạp là 2 và Đã kết hôn là 3 .

Mảng (Array)

Mảng ( Array ) là nơi được cho phép tàng trữ nhiều giá trị theo thứ tự nhất định trong một biến duy nhất. Nó hoàn toàn có thể chứa những giá trị với kiểu dữ liệu khác nhau như chuỗi, số, đối tượng người tiêu dùng … Chiều dài của Array hoàn toàn có thể tự tăng lên hay giảm xuống mỗi khi tất cả chúng ta thêm hay xóa những thành phần trong mảng .
Vị dụ : tất cả chúng ta có nhiều biến như đoạn code sau
type01-1670498344.png
Việc tàng trữ giá trị biến như ví dụ sẽ khiến bạn khó tìm kiếm, sử dụng và tốn bộ nhớ tàng trữ biến. Lúc này sử dụng mảng là giải pháp tương thích. Kết quả là :
type02-1670498344.png

Ngày

Không cần lý giải ; Date thường tàng trữ một ngày ở định dạng YYYY-MM-DD ( cú pháp ISO 8601 ). Ví dụ : 2022/12/30

Thời gian

Lưu trữ thời hạn ở định dạng hh : mm : ss. Bên cạnh thời hạn trong ngày, nó cũng hoàn toàn có thể được sử dụng để tàng trữ thời hạn đã trôi qua hoặc khoảng chừng thời hạn giữa hai sự kiện hoàn toàn có thể dài hơn 24 giờ. Ví dụ : thời hạn kể từ khi một sự kiện đã diễn ra hoàn toàn có thể là hơn 72 giờ ( 72:00:59 ) .

Ngày giờ

Datetime tàng trữ một giá trị chứa cả ngày và giờ ở định dạng YYYY-MM-DD hh : mm : ss. Ví dụ : 2022 – 12-28 12:00:59

Dấu thời gian

Thường được biểu thị bằng thời gian Unix, timestamp biểu thị số giây đã trôi qua kể từ 00:00:00 UTC, ngày 1 tháng 1 năm 1970.

Các mạng lưới hệ thống máy tính thường sử dụng dấu thời hạn để ghi ngày và giờ đúng chuẩn của sự kiện, đến cả số giây, ở định dạng không bị ảnh hưởng tác động bởi múi giờ. Do đó, không giống như ngày giờ, dấu thời hạn sẽ giữ nguyên bất kể vị trí địa lý của bạn .

Data type nâng cao

  • Các mô hình lược đồ (Schema models): Một tập hợp các đối tượng cơ sở dữ liệu.
  • Object Relational Mapping (ORM): Mã tự động chuyển dữ liệu được lưu trữ trong các bảng Cơ sở dữ liệu quan hệ (Relational database) thành các đối tượng. Chúng có thể giúp ánh xạ các đối tượng mã vào cơ sở dữ liệu của bạn.

Ví dụ

Các ngôn từ lập trình khác nhau phân phối những data type khác nhau, cho nhiều mục tiêu sử dụng khác nhau. Tuy nhiên, những data type được sử dụng phổ cập nhất mà bạn cần quan tâm là 11 loại kể trên .
Trong biểu mẫu ĐK tiêu chuẩn, mỗi trường sẽ đồng ý giá trị của một kiểu dữ liệu đơn cử .

  • Trường văn bản lưu đầu vào dưới dạng chuỗi trong khi trường số thường chấp nhận số nguyên.
  • Tên và địa chỉ email luôn ở dạng chuỗi, trong khi các số có thể được lưu trữ dưới dạng kiểu số hoặc chuỗi vì chuỗi là một tập hợp các ký tự bao gồm các chữ số.

Trong những trường có một tùy chọn hay nhiều tùy chọn xác lập trước, những kiểu dữ liệu liệt kê và mảng sẽ phát huy tính năng .
type03-1670498344.png
 

Ví dụ trong biểu mẫu ĐK Facebook ở trên

  • Trường Sinh nhật có 3 trường con, mỗi trường kiểu liệt kê yêu cầu bạn chọn một tùy chọn cho ngày, tháng và năm tương ứng.
  • Trường Giới tính yêu cầu bạn chọn từ hai lựa chọn cho trước hoặc thêm một lựa chọn tùy ý, đầu vào của chúng sẽ được lưu trữ dưới dạng chuỗi.
  • Các chuỗi như mật khẩu luôn được băm hoặc mã hóa.

Ứng dụng của data type

Hiểu về data type rất quan trọng trong việc giúp bạn tận dụng dữ liệu người mua ( data customer ), để thu thập dữ liệu rõ ràng và đồng điệu .

Thiết bị đo lường (Instrumentation)

Quá trình theo dõi dữ liệu hành vi ( behavioral data ) từ những nguồn dữ liệu chính và đồng nhất hóa dữ liệu với mạng lưới hệ thống tàng trữ bên trong hoặc bên ngoài được gọi là thiết bị đo .
Bước tiên phong trong quy trình tiến độ Instrumentation là tạo kế hoạch theo dõi dữ liệu. Khi quyết định hành động những sự kiện nào cần theo dõi và những thuộc tính nào cần tích lũy ( cả thuộc tính sự kiện và tổ chức triển khai ), việc chỉ định loại dữ liệu của từng thuộc tính trong kế hoạch theo dõi giúp quy trình tiến độ hiệu suất cao hơn rất nhiều và ít năng lực xảy ra lỗi .
Điều này đặc biệt quan trọng có ích cho những kỹ sư được giao trách nhiệm tiến hành. Bằng cách bảo vệ rằng mỗi thuộc tính được gửi kèm loại dữ liệu đúng chuẩn, hoàn toàn có thể tránh được sự không đồng điệu của dữ liệu .

Khảo sát (Surveys)

Các câu hỏi trong một cuộc khảo sát hoàn toàn có thể là câu hỏi mở ( văn bản hoặc số ) hoặc đi kèm với những lựa chọn cho trước như drop-down list ( enum ), checkboxes ( mảng ), nút tùy chọn ( boolean ) hoặc thậm chí còn là thanh trượt
Để tàng trữ dữ liệu từ những khảo sát ( trong cơ sở dữ liệu hoặc mạng lưới hệ thống của bên thứ ba ), bạn cần chỉ định tên thuộc tính ( ngành_tên, nghề nghiệp_chức vụ, hủy_lý do, có / không_hài lòng, v.v. ) và kiểu dữ liệu của nó ( chuỗi, số, boolean, v.v. ). Tên thuộc tính tàng trữ giá trị đã nhập và kiểu dữ liệu xác nhận rằng giá trị mong đợi .
Như vậy, dữ liệu sẽ có sự đồng nhất và giúp việc nghiên cứu và phân tích và kích hoạt dữ liệu trở nên thuận tiện hơn. Nên nhớ rằng những câu hỏi mở sẽ khiến việc nghiên cứu và phân tích khó khăn vất vả hơn vì bạn không hề tổng hợp những câu vấn đáp trừ khi bạn quy đổi dữ liệu bằng cách nghiên cứu và phân tích cú pháp từng câu vấn đáp và trích xuất văn bản tương thích với quy tắc .
Với những lựa chọn cho trước, việc nghiên cứu và phân tích trở nên đơn thuần và không bị ảnh hưởng tác động ngay cả khi bạn đổi khác những lựa chọn ở quá trình sau .
Việc vận dụng kiến ​ ​ thức của về Data Type không chỉ dừng lại trong việc thu thập dữ liệu hay thiết bị đo, những hoạt động giải trí như quản trị dữ liệu, tích hợp dữ liệu và tăng trưởng ứng dụng nội bộ ( sử dụng những công cụ không có mã hoặc ít mã ) cũng sẽ trở nên thuận tiện hơn rất nhiều .

Tầm quan trọng của data type

Mỗi ngôn ngữ lập trình đều có một hệ thống data type. Nếu không, máy tính sẽ không biết cách để thể hiện dữ liệu trong chương trình; đồng thời không biết lấy kiểu dữ liệu nào hay thêm kiểu dữ liệu nào, thậm chí nó cũng không biết cách lưu trữ những dữ liệu ở đâu.

Chẳng hạn, bằng cách định nghĩa một biến là số nguyên, máy tính sẽ biết rằng cần bao nhiêu byte để đại diện thay mặt cho giá trị này và đặc biệt quan trọng là biết được cách triển khai những phương pháp trên dữ liệu đó. Nói cách khác, cách duy nhất để máy tính biết cách giải quyết và xử lý dữ liệu chính là cho chúng biết data type mà chúng phải giải quyết và xử lý .
Việc hiểu kiểu dữ liệu và biết cách bộc lộ chúng mang lại cho tất cả chúng ta những quyền lợi to lớn, như :

  • Chúng ta sẽ có những chương trình hiệu quả hơn nhờ việc tối ưu được bộ nhớ và nơi lưu trữ. Bằng cách biết rằng một mảng của số nguyên tốn ít không gian hơn một mảng của số lẻ, giúp bạn tiết kiệm được hàng kilobytes thậm chí là megabyte.
  • Việc hiểu được data type sẽ giúp chúng ta giải mã được những “con bug” và những vấn đề liên quan đến kiểu dữ liệu. Ví dụ khi chương trình báo lỗi không thể cộng hai số vì một trong hai là kiểu chuỗi, bạn sẽ hiểu được lý do tại sao và giúp bạn tránh mắc những lỗi tương tự.
  • Khi hiểu về cách kiểu dữ liệu hoạt động, bạn sẽ giống như Neo trong phim “The Matrix”, người biết cách bẻ cong những quy tắc.

Data type phổ cập trên tổng thể những ngôn từ lập trình, dù phương pháp mà những ngôn từ lập trình giải quyết và xử lý chúng có sự độc lạ. Chúng hoạt động giải trí như một thuộc tính hướng dẫn máy tính cách diễn giải dữ liệu. Hy vọng bài viết trên đã giúp bạn hiểu rõ hơn về data type và có thêm nhiều kiến thức và kỹ năng trong việc lựa chọn ngôn từ lập trình trong dự án Bất Động Sản sau đó. Cảm ơn bạn đã dành thời hạn đọc bài viết này, nếu thấy nội dung có ích hãy san sẻ cho nhiều người biết hơn nhé !