Tìm hiểu về Migration

Migration là một tính năng của Active record cho phép bạn thay đổi cả cấu trúc và dữ liệu trong database. Thay vì thay đổi trực tiếp vào database thì Rails cho phép bạn sử dụng Ruby DSL để mô tả việc thay đổi các table.
Tiện gần đây dự án mình gặp vấn đề về migration nên mình viết bài viết này. Bài toán đặt ra là Khách hàng muốn rollback migration về thời điểm nào đó chỉ để chạy code ở version nào đó thôi mà không phải code hiện tại. Và lúc đó bên mình đã rollback nhưng bị lỗi rollback mà trong lúc code k ai nghĩ đến trường hợp đó cả. Đó cũng là một vấn đề mà ta cần hiểu rõ hơn về migration để tránh những trường hợp như vậy.
Sau khi đọc bài viết bạn có thể biết thêm về:

Migration là một cách thuận tiện để thay đổi cấu trúc bảng và dữ liệu trong database 1 cách dễ dàng. Bằng cách sử dụng Ruby DSL bạn k cần phải viết SQL bằng tay, nó có thể giúp bạn thay đổi database 1 cách độc lập
Tưởng tượng mỗi migration tương ứng vs 1 version của database. Ban đầu, schema là rỗng, và mỗi lần migration thì sẽ modify để add hoặc remove table, columns hoặc rows. Active record biết cách để update schema theo thời gian. Và từ bất cứ thời điểm nào trong quá khứ cũng có thể update version của schema đến bản mới nhất. Active record cũng sẽ update file db/schema.rb để làm cho thống nhất với cấu trúc mới nhất của database.
Chúng ta cùng nhìn qua ví dụ về 1 migration:

Đây là 1 migration tạo bảng products trong database. Có 2 trường đó là namedescription. Một cột khóa chính là id cũng sẽ được thêm vào sau khi chạy migration này, đây là khóa chính mặc định cho tất cả model của Active Record. timestamps sẽ thêm vào bảng 2 cột đó là : created_atupdated_at. Các cột này sẽ được quản lý tự động bởi ActiveRecord nếu chúng tồn tại
Trước khi thực hiện migration thì không tồn tại table nào cả. Run migration thì table sẽ được sinh ra. Và Active record cũng có cách để back lại cái migration lúc nãy bằng cách là Rollback lại cái migration đó thì bảng được tạo lúc trước sẽ bị xóa.
Ta cũng có thể viết migration theo cách khác để hiểu cách nó rollback:

dir.up là chạy migration. dir.down là chạy rollback lại, quay lại thời điểm trước khi chạy migration
Ví dụ như nếu chúng ta change_column thì rollback sẽ bị lỗi, buộc phải viết code theo kiểu này.

Migration được lưu tại thành các file tại db/migrate. Tên của các file migration sẽ theo dạng YYYYMMDDHHMMSS_create_products.rb . File name kèm theo thời gian để phân biệt các version migration. Ví dụ: file name là 20080906120000_create_products.rb thì class CreateProducts phải được định nghĩa. Rails sử dụng dấu thời gian này để xác định migration nào cần được chạy và theo thứ tự nào, do đó, nếu bạn đang sao chép migration từ một ứng dụng khác hoặc tự tạo ra một tệp tin, hãy nhận biết vị trí của nó theo thứ tự.
Và tất nhiên, cứ mỗi lần tạo migration chúng ta k thể ngồi tính thời gian để tạo file dc. Active Record cung cấp một cách tạo đơn giản, dễ dàng:

Cau lệnh sẽ tạo ra 1 migration mới:

Nếu migration tên có dạng “AddXXXToYYY” hoặc “RemoveXXXFromYYY” sẽ tạo ra các migration add_column hoặc remove_column. Ta có thể thêm vào các column và type của chúng theo sau:

sẽ tạo ra:

Các migration có tên theo dạng CreateXXX và theo sau là danh sách các tên column và type của chúng sẽ tạo ra table có tên XXX với những column đã liệt kê. Ví dụ:

Sẽ tạo ra migration:

Khi tạo model có thể tạo migration theo đó. Ví dụ chúng ta tạo 1 model mới tên là Product.

Nó sẽ tạo ra 1 migration mới như sau:

Bạn có thể thêm nhiều cột khác nếu muốn 😃)

Rails cung cấp 1 tập hợp của bin/rails tasks để chạy migration
Đầu tiên câu lệnh chúng ta hay sử dụng nhất đó là rails db:migrate . Ở đây nó chỉ chạy các migration chưa chạy,. các migration chạy rồi nó sẽ k chạy lại nữa. Nó sẽ chạy theo thứ tự thời gian
Một lưu ý là khi chạy db:migrate nó cũng sẽ tự động chạy db:schema:dump để cập nhập file db/schema.rb cho trùng khớp với cấu trúc database của bạn
Nếu bạn muốn chạy 1 migration cụ thể. chúng ta có thể chạy bằng cách lấy tên version là dãy số dài ở file migration và chạy:

Nếu như version 20080906120000 lớn hơn version hiện tại, nó sẽ chạy những thay đổi (up method) của tất cả các migration bao gồm cả 20080906120000 và sẽ không chạy bất kì các migration sau nó.

Rollback được sử dụng khi chúng ta tạo sai 1 migration và muốn sửa chúng, muốn quay lại tại thời điểm chạy migration lỗi đó. Ta có thể quay lại migration trước bằng cách:

Nó sẽ rollback tại thời điểm mới nhất của migration, nếumuốn rollback lại nhiều version trước đó nữa thì chỉ định parameter STEP. Ví dụ:

Nó sẽ revert 3 migration gần nhất.
Ta dùng db:migrate:redo để chạy roll back và migration lại:

Đây là các cách giúp chúng ta sửa sai các migration mà không cần phải reset migration.

Một lưu ý khi tạo migration chúng ta nên kiểm tra xem nó có rollback được hay không ^^. Có thể nó sẽ không rollback được do nhiều lý do. Ví dụ như change_column thì sẽ không rollback dc, hoặc khi ta thêm điều kiện vào để chạy migration.