Tự học Python: Pandas và Anaconda

Tự học Python: Pandas và AnacondaTự học Python: Pandas và AnacondaBắt đầu học Python chỉ trong 10 phút bằng việc setup Anaconda và tập sử dụng pandas rất cơ bản. Thông thường mọi người sẽ bảo là vào website chính thức của Python và tải Python về sau đó cài pandas, jupyter-notebook, … qua pip mới là tutorial hoàn hảo .Mình tin rằng với việc tiếp cận được những khái niệm cơ bản một cách nhanh nhất sẽ giúp bạn hiểu được một cách “ trừu tượng ” về Data tốt hơn. Cho nên những bạn hoàn toàn có thể tải ngay Anaconda, nó sẽ gồm có rất nhiều thứ để giúp bạn hoàn toàn có thể làm được việc này .

Anaconda là gì

Anaconda là tên một loại trănAnaconda là một gói ứng dụng, gồm có rất nhiều ứng dụng, thư viện khác nhau được đóng gói sẵn và đa phần viết bằng Python hoặc hoạt động giải trí trên Python. Anaconda đóng gói sẵn hàng trăm thư viện Data Science từ rất cơ bản như Pandas, Numpy, Scipy, … cho đến Scikit-learn, …

Như vậy khi bạn cài đặt Anaconda bạn đã cài đặt cả pandas rồi, bạn chỉ cần mở Jupyter-Notebook lên để chạy lệnh thôi.

Bạn hoàn toàn có thể tải Anaconda phiên bản không tính tiền cho cá thể tại link dưới đây :https://www.anaconda.com/products/individualSau khi bạn setup xong bước tiên phong sẽ là mở “ Anaconda Navigator ”, có giao diện giống với phía bên dướiMở Jupyter-Notebook

Mở Jupyter-Notebook

Jupyter-notebookSau khi đã mở thành công xuất sắc Anaconda Navigator, bạn liên tục với việc mở tiếp Jupyter-notebook, lúc này bạn sẽ thấy giao diện như bên dưới. Trong đó có nút “ New ” là nơi bạn hoàn toàn có thể tạo thêm file python để lập trình, hoặc tạo thêm thư mục .

Tạo thư mục để làm việc

Bạn chọn Folder để tạo folderBạn chọn Python3 để tạo notebookMình tạo thư mục Tuan_analytic và file tên là hello_world, tất cả chúng ta sẽ có giao diện như dưới đây :Folder và tên như hướng dẫn

Tải dữ liệu mẫu vào thư mục

Để triển khai ví dụ chopandas mình đã tìm một file tài liệu mẫu ( dạng csv ) gồm có chiều cao và cân nặng của 25,000 người. Dữ liệu hoàn toàn có thể được tải xuống tại đây .Bạn hoàn toàn có thể tải file khi nhấn nút tải xuống ngay phía trên, file hoàn toàn có thể mở bằng excel nếu bạn muốn xem thử. Sau đó thư mục của bạn sẽ trông như thế này .

Hello World cùng Python

Code dòng hello world đầu tiên

Đầu tiên hãy mở file hello world như khi nãy tất cả chúng ta đã chuẩn bị sẵn sàng và gõ vào

print('Hello World')

Sau đó nhấn tổng hợp phím Shift + Enter để chạy dòng lệnh này, note book sẽ trả về giá trị giống như bên dưới .Dòng Hello World đầu tiên

Như vậy là bạn đã viết được dòng hello world bằng Python đầu tiên rồi, quá đơn giản phải không nào, bây giờ chúng ta sẽ tìm cách để đọc file dữ liệu hw_25000.csv như mình đã chuẩn bị nhé.

Hướng dẫn sử dụng pandas

Đọc file dữ liệu dạng bảng, có đuôi .csv

Để đọc được file dạng bảng bạn phải import thư viện pandas và chọn loại tài liệu để đọc, hãy sử dụng lệnh bên dưới .

import pandas as pd

du_lieu = pd.read_csv('hw_25000.csv')

Và chạy như phía trên. Bạn vẫn không thấy gì cả ? Tất nhiên rồi bạn phải gọi bảng này ra để tìm hiểu thêm nữa. Hãy làm như hình dưới để có hiệu quả mong ước .Xem

Một số lệnh pandas cơ bản

Chọn cột

Bạn chỉ cần nhập tên cột vào bảng theo định dạng bên dưới để chọn riêng 1 cộtChọn cột chiều caoNgoài ra bạn còn hoàn toàn có thể thử một loạt lệnh cơ bản với pandas ở bên dưới, sau khi đã chọn được một cột .

Chọn giá trị lớn nhất trong cột (max)

du_lieu['Height'].max()

Chọn giá trị nhỏ nhất trong cột (min)

du_lieu['Height'].min()

Giá trị trung bình của cột (mean)

du_lieu['Height'].mean()

Giá trị trung vị của cột (median)

du_lieu['Height'].median()

Ngoài ra còn rất nhiều lệnh khác bạn hoàn toàn có thể tìm hiểu thêm thêm tại website chính thức của pandas .

Kết

Vậy là mình đã hướng dẫn những bạn cách tự cài Anaconda, sau đó tự viết cơ số lệnh đơn thuần trong Python và pandas. Mong đây sẽ là khởi đầu tốt cho những bạn muốn khám phá về pandas, cũng như data analytics, data science nói chung. Nếu bạn thấy bài viết có ích hoàn toàn có thể ủng hộ qua mục Ủng hộ tuấn ly cafe nhé :Support Tuan | Analytic