Siêu Dữ Liệu Metadata Là Gì? – Make Internet Easier

Ngay cả khi bạn chưa khi nào nghe đến thuật ngữ siêu dữ liệu, bạn chắc như đinh đã quen thuộc với nó – bạn hoàn toàn có thể sử dụng nó hàng ngày mà không hề nhận ra. Siêu dữ liệu là một trong những thứ thiết yếu quản trị để ẩn trong tầm nhìn rõ ràng .

Siêu dữ liệu là gì ?

Siêu dữ liệu nghe có vẻ như là một thuật ngữ đáng sợ, nhưng không phải vậy – siêu dữ liệu chỉ là dữ liệu miêu tả những dữ liệu khác .

Theo nhiều cách, siêu dữ liệu rất giống bằng lái xe hoặc một loại ID khác mà bạn quen thuộc. ID chính thức thường sẽ có ngày sinh, chiều cao, màu mắt, ảnh và các thông tin khác về bạn. Siêu dữ liệu thực hiện vai trò tương tự đối với các tệp kỹ thuật số được tìm thấy trên máy tính. Siêu dữ liệu thường sẽ mô tả thời điểm một tệp hoặc thư mục được tạo, khi nó được sửa đổi lần cuối và các thuộc tính quan trọng khác về nó.

Các loại tệp khác nhau thường sẽ có siêu dữ liệu khác nhau. Dưới đây là 1 số ít ví dụ đơn cử về siêu dữ liệu mà bạn hoàn toàn có thể tìm thấy được đính kèm vào những tệp phổ cập .

Ví dụ về Siêu dữ liệu

tin tức được tàng trữ dưới dạng siêu dữ liệu khác nhau đáng kể giữa những loại tệp. Như bạn hoàn toàn có thể tưởng tượng, hình ảnh hoặc hình ảnh cần siêu dữ liệu khác với tài liệu văn bản .

Ảnh và Video

Giả sử bạn đã tham gia một chuyến đi bộ đường dài bằng cách sử dụng GPS của điện thoại cảm ứng để hướng dẫn bạn. Trong chuyến đi của mình, bạn đã rút điện thoại thông minh ra và chụp một bức ảnh về một loài động vật hoang dã, một loại nấm kỳ lạ hoặc một khung cảnh tuyệt đẹp. Ngay sau khi bạn chụp ảnh, có thông tin đính kèm với nó : setup máy ảnh, gồm có độ dài phơi sáng, ISO, F-stop, nhà phân phối máy ảnh, thời hạn chụp ảnh và hoàn toàn có thể là tọa độ GPS của máy ảnh khi hình ảnh được chụp .Khi dữ liệu đó đã được lưu, nó hoàn toàn có thể được sử dụng để sắp xếp và phân loại hình ảnh. Ứng dụng thư viện ảnh trên điện thoại thông minh của bạn là một ví dụ nổi bật – bạn hoàn toàn có thể sắp xếp hình ảnh của mình theo ngày tháng và nếu bạn đã bật tính năng gắn thẻ địa lý, kể cả vị trí. Các ứng dụng thư viện ảnh tân tiến thậm chí còn hoàn toàn có thể đính kèm dữ liệu bổ trợ miêu tả nội dung của hình ảnh, ví dụ điển hình như “ Thức ăn ”, “ Thú cưng ” hoặc tên của một người đơn cử. Đó là những gì được cho phép bạn tìm kiếm hình ảnh trên điện thoại thông minh của mình dựa trên nội dung của chúng. Dưới đây là một ví dụ về ảnh được chụp bằng GPS của điện thoại cảm ứng được bật :Bạn hoàn toàn có thể xem trực tiếp siêu dữ liệu của hình ảnh trên điện thoại cảm ứng hoặc PC của mình .

Siêu dữ liệu GPS được đính kèm trong hình ảnh chỉ đúng mực như GPS trong điện thoại di động của bạn, nhưng trong hầu hết những trường hợp, siêu dữ liệu đó đúng mực trong vòng vài mét .

Các tệp video sẽ có nhiều thông tin giống nhau và sau đó là một số ít thông tin bổ trợ tương quan đến vận tốc khung hình và âm thanh được link với video .

Âm thanh

Siêu dữ liệu âm thanh sẽ gồm có những thứ thường thì, như khi tệp được tạo, nhưng nó cũng lưu thông tin đơn cử về tệp âm thanh. Siêu dữ liệu cho những tệp âm thanh thường chứa thông tin về nghệ sĩ, album, số và tên bản nhạc, cũng như thông tin về bản thân âm thanh, như vận tốc bit, độ sâu bit và vận tốc mẫu .

Tin nhắn

Tin nhắn bạn gửi cho người khác cũng có siêu dữ liệu được link. Ví dụ nổi bật về siêu dữ liệu được đính kèm với thư là thời hạn gửi, người nhận và thông tin về bất kể tệp đính kèm nào mà thư hoàn toàn có thể có. Một số ứng dụng gửi tin nhắn cũng hoàn toàn có thể nhúng siêu dữ liệu bổ trợ vào tin nhắn của họ, ví dụ điển hình như thời hạn nhận và phản ứng hình tượng cảm hứng .

Phần lan rộng ra tệp

Một loại siêu dữ liệu đặc biệt quan trọng quan trọng là phần lan rộng ra tệp. Phần lan rộng ra tệp là những thứ như PNG, TXT, DOCX, JPGs, MP3, v.v. Phần lan rộng ra tệp được cho phép Windows biết loại dữ liệu mong đợi và cách mở tệp. Nếu không có nó, Windows sẽ không hề tự động hóa biết cách mở nó và bạn sẽ phải nhu yếu nó mở tệp theo cách thủ công bằng một chương trình đơn cử .

Lưu ý: Không phải tất cả các hệ điều hành đều sử dụng phần mở rộng tệp để lưu trữ siêu dữ liệu định dạng tệp.

Các tập tin máy tính khác

Hầu hết những tệp đều có siêu dữ liệu khá đơn cử cho loại tệp, tuy nhiên, có 1 số ít siêu dữ liệu nhất định về cơ bản là phổ cập. Nếu bạn kiểm tra những thuộc tính của hầu hết mọi tệp trên PC của mình – không phân biệt loại tệp – bạn sẽ thấy thông tin về nơi tệp được tàng trữ, khi nó được tạo, khi nó được truy vấn, khi nó được sửa đổi và khi nào tạo. Đây là một ví dụ từ Windows 10 :

Siêu dữ liệu được những cá thể sử dụng như thế nào ?

Nếu bạn sử dụng bất kể loại máy tính văn minh nào – kể cả điện thoại di động – thì bạn tiếp tục sử dụng siêu dữ liệu. Siêu dữ liệu là thứ cho phép bạn sắp xếp những tệp của mình theo loại. Đây là thứ cho phép bạn sắp xếp những tệp của mình theo “ Ngày tạo ”, “ Ngày sửa đổi ” hoặc “ Ngày truy vấn ”. Hầu hết những trình phát đa phương tiện văn minh đều được cho phép bạn liệt kê nhạc của mình theo vận tốc bit hoặc sắp xếp thư viện phim của bạn thành những hạng mục dựa trên độ phân giải. Các website thường chứa “ thẻ meta ”, một loại siêu dữ liệu đơn cử được tìm thấy trong tiêu đề của website được sử dụng để miêu tả nội dung của website với công cụ tìm kiếm .

Bất cứ khi nào bạn phân loại tệp, thư mục hoặc website, bạn đang dựa vào siêu dữ liệu .

Siêu dữ liệu được sử dụng như thế nào ?

Các cá thể sử dụng siêu dữ liệu theo những cách đơn cử, nhưng còn bức tranh lớn thì sao ? Mỗi việc bạn làm trên máy tính đều tạo ra dữ liệu và siêu dữ liệu. Hãy xem xét rằng có hàng chục tỷ máy tính đang được sử dụng ngày này, gồm có khoảng chừng sáu đến bảy tỷ điện thoại thông minh mưu trí – tất cả chúng ta cùng nhau tạo ra một lượng siêu dữ liệu không hề giám sát được mỗi ngày .

Nhắm tiềm năng Quảng cáo và Nội dung đến Những người Cụ thể

tin tức đó không chỉ bị vô hiệu. Một lượng lớn trong số đó được đưa vào những thuật toán phức tạp và những mô hình học máy để nghiên cứu và phân tích. Điều gì xảy ra sau đó thực sự phụ thuộc vào vào người đã tích lũy siêu dữ liệu và những gì họ muốn tìm hiểu và khám phá – nó hoàn toàn có thể được sử dụng để nghiên cứu và phân tích mọi thứ, từ hành vi của một cá thể đến những quy mô và xu thế lớn nhất trong xã hội .Các trường hợp sử dụng trực tiếp nhất là quảng cáo được nhắm tiềm năng và đề xuất kiến nghị nội dung được cá thể hóa. Bạn đã khi nào thấy nguồn cấp dữ liệu mạng xã hội của mình chứa đầy những quảng cáo tương quan đến thứ gì đó mà bạn đã tìm kiếm trên điện thoại cảm ứng của mình chưa ? Bạn đã nhấp vào điều gì đó không bình thường trên YouTube chỉ để nhận thấy rằng những yêu cầu của bạn biến hóa để gồm có nhiều hiệu quả hơn như thứ bạn vừa nhấp vào ? Đó là thuật toán đang hoạt động giải trí, giải quyết và xử lý dữ liệu và siêu dữ liệu được link với bạn để hiển thị tác dụng mà nó “ nghĩ ” sẽ có nhiều năng lực lôi cuốn sự chú ý quan tâm của bạn và khiến bạn nhấp vào .Việc sử dụng siêu dữ liệu để tăng mức độ tương tác của người dùng có 1 số ít hậu quả không mong ước. Đáng quan tâm nhất, nó có khuynh hướng ưu tiên nội dung cực đoan về mặt cảm hứng : nó khiến bạn cảm thấy thực sự tốt hoặc thực sự tồi tệ – cả hai trường hợp thường kích thích hơn nội dung thực tiễn. Đó là một phần quan trọng của những gì khiến việc lướt qua trên mạng xã hội trở nên cực kỳ nghiện .Đôi khi, nó cũng dẫn đến những quảng cáo mà mọi người thấy khá xâm phạm – không có gì giống như kiểm tra WebMD khi bạn đang cảm thấy không dễ chịu chỉ để thấy dòng thời hạn Facebook của bạn được tải với những quảng cáo về thuốc điều trị một list những bệnh lý giải thích những triệu chứng của bạn .

Lưu ý: Facebook đã hứa hạn chế một số quảng cáo liên quan đến y tế , trong số những thứ khác, và trước đó đã thêm các hạn chế bổ sung đối với quảng cáo dược phẩm . Chúng tôi sẽ xem những thay đổi này diễn ra như thế nào trong tương lai.

Tất nhiên, ngay cả khi những chủ trương truyền thông online xã hội biến hóa và những thứ này ngừng hiển thị trên nguồn cấp dữ liệu truyền thông online xã hội của bạn, điều đó không phủ nhận thực tiễn là thông tin đã có sẵn và thường có sẵn cho người trả giá cao nhất. Trước đây, phần nhiều dữ liệu nhạy cảm của bạn đã được bảo vệ hợp pháp – ví dụ : ở Hoa Kỳ, HIPAA bảo vệ thông tin y tế của bạn khỏi bị truyền hoặc sử dụng ngoại trừ trong những điều kiện kèm theo rất đơn cử. Tuy nhiên, có rất ít giải pháp bảo vệ như vậy sống sót so với thông tin tích lũy được từ siêu dữ liệu của bạn ở hầu hết những khu vực pháp lý, mặc dầu điều đó đang biến hóa .

Siêu dữ liệu được tích lũy để giám sát

Có rất nhiều cách sử dụng cho siêu dữ liệu bên cạnh nội dung chỉ quảng cáo và nhắm tiềm năng. Trong số những tranh cãi nhất là giám sát. Edward Snowden đã gây ra một cuộc tranh cãi lớn khi ông phân phối vật chứng cho thấy Cơ quan An ninh Quốc gia Hoa Kỳ đang tích lũy siêu dữ liệu từ hàng trăm triệu tin nhắn văn bản mỗi ngày, trong số những thứ khác .Cảnh sát hoàn toàn có thể làm điều gì đó tựa như, mặc dầu ở quy mô nhỏ hơn nhiều, bằng cách sử dụng tháp cá đuối. Tháp Stingray đóng giả tháp điện thoại di động thực để lưu lượng truy vấn di động lân cận được chuyển qua chúng. Trong trường hợp này, loại dữ liệu được tích lũy hoàn toàn có thể khác nhau – bất kể thứ gì được truyền đi không được mã hóa hoàn toàn có thể sẽ trọn vẹn hoàn toàn có thể đọc được, trong khi chỉ 1 số ít siêu dữ liệu sẽ bị lộ nếu thông tin liên lạc được mã hóa .

Lưu ý: Một số ứng dụng nhắn tin (như Signal ) cố gắng giảm thiểu lượng siêu dữ liệu không được mã hóa và họ nói rằng họ cũng không lưu trữ siêu dữ liệu.

Ngay cả khi không có nội dung trong thực tiễn của thư của bạn, vẫn có nhiều thông tin có sẵn trong siêu dữ liệu để xác lập bạn tích hợp với ai, khi nào bạn trò chuyện với họ và thậm chí còn có năng lực tích lũy những hoạt động của bạn .

Siêu dữ liệu có phải là mối chăm sóc về quyền riêng tư không ?

Hầu hết mọi tệp kỹ thuật số ngoài kia sẽ có một số ít siêu dữ liệu được link với nó – đôi lúc bản thân tệp chứa siêu dữ liệu, những lần khác, siêu dữ liệu được tàng trữ riêng bởi hệ quản lý. Phần lớn video và hình ảnh được tải lên Internet giờ đây đã tự động hóa xóa siêu dữ liệu – toàn bộ những website tiếp thị quảng cáo xã hội lớn và hầu hết những nền tảng tàng trữ hình ảnh đều xóa siêu dữ liệu và hầu hết những ứng dụng trò chuyện tân tiến, gồm có Slack, Discord, WhatsApp, Facebook Messenger, Signal, và Telegram .

Cảnh báo: Tải ảnh của bạn lên dịch vụ lưu trữ đám mây sẽ không xóa siêu dữ liệu, vì vậy hãy cẩn thận khi chia sẻ ảnh theo cách đó. Gửi hình ảnh qua email cũng sẽ không loại bỏ siêu dữ liệu.

Quan trọng hơn, mọi thứ bạn làm đều tạo ra siêu dữ liệu. Siêu dữ liệu được tạo bất kể lúc nào bạn truyền hoặc nhận dữ liệu qua mạng di động hoặc trên internet. Dữ liệu này được tích lũy bởi những chính phủ nước nhà và những công ty tư nhân và hoàn toàn có thể được sử dụng để nghiên cứu và phân tích hành vi của những cá thể hoặc nhóm .

Xem xét mức độ phổ biến của siêu dữ liệu – và mức độ tiết lộ của nó – rõ ràng đó là một mối quan tâm về quyền riêng tư.

Hầu hết những thiết bị mưu trí đều tích lũy thông tin sử dụng và Internet of Things ( IoT ) chỉ chuẩn bị sẵn sàng mở rộng lượng dữ liệu và siêu dữ liệu được tích lũy. Siêu dữ liệu của bạn thường hoàn toàn có thể bật mý như dữ liệu của bạn. Thực hiện những bước bạn hoàn toàn có thể để bảo vệ quyền riêng tư của mình và thận trọng khi tải thông tin lên internet .