Hướng dẫn sử dụng tập tin (File) trong C

0
1051

Một số khái niệm

Dữ liệu trong chương trình được lưu trữ ở RAM máy tính, vì thế khi kết thúc chương trình, tắt máy dữ liệu sẽ bị giải phóng (mất dữ liệu). Để tránh vấn đề đó dữ liệu cần phải lưu trữ trên bộ nhớ ngoài (đĩa cứng, USB, …) dưới dạng file. File có các đặc trưng sau:

  • Là một đơn vị lưu trữ logic.
  • Được biểu thị bằng một tên.
  • Bao gồm một tập hợp dữ liệu do người tạo xác định.
  • Được lưu trữ trên thiết bị lưu trữ ngoài bằng cách ánh xạ lên đơn vị vật lý của thiết bị.

Hầu hết các chương trình đều cần phải lưu trữ dữ liệu sau khi xử lý. Vì vậy C cung cấp cho chúng ta các kỹ thuật xử lý lưu trữ trên file.

C hỗ trợ các thao tác truy xuất như

+ Tạo mới.

+ Đọc, ghi phần tử.

+ Xóa.

+ Đổi tên.

Mỗi khi hệ điều hành mở một file, hệ điều hành thao tác với đĩa, truy xuất thông tin cơ bản của file, rồi trả về địa chỉ vùng lưu trữ gọi là handle của file – file ID – để nhận dạng duy nhất cho file này. Chương trình của chúng ta mỗi khi thao tác phải thông qua biến pointer đó. Để lấy pointer của file, chúng ta phải khai báo biến file, ngôn ngữ lập trình C dùng khai báo biến FILE * f, để lấy handle bằng lệnh mở file.

Cách thao tác với file

Thao tác chuẩn: người lập trình không cần biết quá trình thực hiện việc thao tác với file như thế nào. Đó là việc của hệ thống.

Thao tác mức hệ thống (thao tác thủ công): thao tác file thông qua bộ đệm (buffer – một  vùng nhớ). Người lập trình phải tự quản lý các bộ đệm đọc ghi file. Thao tác file này gần giống với cách thao tác file của hệ điều hành MS – DOS. Thông thường chỉ có những người lập trình hệ thống mới sử dụng thao tác file mức hệ thống.

Thao tác với file là phải thao tác với phần cứng. Do đó, việc thao tác với file có thể thành công hoặc thất bại.

Ngôn ngữ lập trình C xem file như là một dòng (stream) các byte, với các thiết bị xuất nhập theo từng byte cũng được xem là file, C định nghĩa sẵn các tên cho các thiết bị này và các file này đã được mặc định mở sẵn cho ta truy xuất ngay khi mở máy tính.

Handle Tên Thiết bị
0

1

2

3

4

stdin

stdout

stderr

stdaux

stdprn

Standard input –Thiết bị nhập chuẩn – Bên phím

Standard output – Thiết bị xuất chuẩn – Màn hình

Standard error – Thiết bị xuất lỗi chuẩn – Màn hình

Standard auxililary – Thiết bị ngoại vi chuẩn – Cổng nối tiếp

Standard printer – Thiết bị in chuẩn – Máy in song song

Tên và ý nghĩa tương ứng của các lệnh trong thư viện chuẩn

 

Khi thao tác với file, ở mỗi thời điểm chỉ truy xuất được một phần tử lưu trữ trong file. Vị trí hiện hành đang thao tác (file position) gọi là chỉ số trong file hay con trỏ file – chính là số thứ tự của phần tử truy xuất hiện hành. Chỉ số thứ tự này bắt đầu từ 0.

Kiểu file văn bản thường hay được dùng trong hệ điều hành UNIX, file thường hay gặp ở DOS. Do vậy, dòng Borland duy trì cả hai dạng để có sự tương hợp với cả hai hệ điều hành.

File văn bản (Text File): là loại tập tin dùng để ghi các ký tự lên đĩa. Xem chi tiết tại đây

  • Điểm đặc biệt là dữ liệu của tập tin được lưu trữ thành các dòng, mỗi dòng được kết thúc bằng ký tự xuống dòng (new line), ký hiệu ‘\n’; ký tự này là sự kết hợp của 2 ký tự CR (Carriage Return – Về đầu dòng, mã Ascii là 13) và LF (Line Feed – Xuống dòng, mã Ascii là 10).
  • Mỗi tập tin được kết thúc bởi ký tự EOF (End Of File) có mã Ascii là 26 (xác định bởi tổ hợp phím Ctrl + Z).
  • Truy xuất tập tin theo kiểu văn bản chỉ có thể truy xuất theo kiểu tuần tự.

File nhị phân: Dữ liệu được xem như là một dãy byte liên tục, việc xử lý với tập tin dựa trên việc đọc ghi dãy byte. Xem chi tiết tại đây

  • Biến tập tin: là một biến thuộc kiểu dữ liệu tập tin dùng để đại diện cho một tập tin. Dữ liệu chứa trong một tập tin được truy xuất qua các thao tác với thông số là biến tập tin đại diện cho tập tin đó.
  • Con trỏ tập tin: Khi một tập tin được mở ra để làm việc, tại mỗi thời điểm, sẽ có một vị trí của tập tin mà tại đó việc đọc/ghi thông tin sẽ xảy ra. Người ta hình dung có một con trỏ đang chỉ đến vị trí đó và đặt tên nó là con trỏ tập tin.
  • Sau khi đọc/ghi xong dữ liệu, con trỏ sẽ chuyển dịch thêm một phần tử về phía cuối tập tin. Sau phần tử dữ liệu cuối cùng của tập tin là dấu kết thúc tập tin EOF (End Of File).

Quy trình thao tác với tập tin (File)

  • Khai báo biến tập tin.
  • Mở tập tin bằng hàm fopen().
  • Thực hiện các thao tác xử lý dữ liệu của tập tin bằng các hàm đọc/ghi dữ liệu.
  • Đóng tập tin bằng hàm fclose().

Ở đây, ta thao tác với tập tin nhờ các hàm được định nghĩa trong thư viện stdio.h.

Khai báo biến tập tin

Cú pháp

FILE <Danh sách các biến con trỏ, đại diện cho tập tin>

Thao tác file chuẩn                                        FILE * f;

Thao tác mức hệ thống                                  int f;

Dữ liệu trên file là một dãy các byte(8 bit) cógiá trị từ 0 đến 255. Số byte của dãy là kích thước thật của file(size on disk).

Các biến trong danh sách phải là các con trỏ và được phân cách bởi dấu phẩy(,).  Ví dụ: FILE *f1,*f2;

Mở tập tin

Cú pháp

FILE *fopen(char *Path, const char *Mode)

Trong đó:

  • Path: chuỗi chỉ đường dẫn đến tập tin trên đĩa.
  • Mode: chuỗi xác định cách thức mà tập tin sẽ mở. Các giá trị có thể của Mode:
Chế độ Ý nghĩa
r Mở tập tin văn bản để đọc
w Tạo ra tập tin văn bản mới để ghi
a Nối vào tập tin văn bản
rb Mở tập tin nhị phân để đọc
wb Tạo ra tập tin nhị phân để ghi
ab Nối vào tập tin nhị phân
r+ Mở một tập tin văn bản để đọc/ghi
w+ Tạo ra tập tin văn bản để đọc ghi
a+ Nối vào hay tạo mới tập tin văn bản để đọc/ghi
r+b Mở ra tập tin nhị phân để đọc/ghi
w+b Tạo ra tập tin nhị phân để đọc/ghi
a+b Nối vào hay tạo mới tập tin nhị phân

Mặc định là mở dạng text nếu không có xác định là b, nếu rõ ràng hơn thì thêm chỉ định t để xác định là kiểu text.

Hàm fopen trả về một con trỏ tập tin. Chương trình của ta không thể thay đổi giá trị của con trỏ này. Nếu có một lỗi xuất hiện trong khi mở tập tin thì hàm này trả về con trỏ NULL.

Ví dụ: Mở một tập tin tên TEST.txt để ghi.

 

Kiểm tra con trỏ f với giá trị NULL cho phép xác định được lệnh thực hiện thành công hay không?

Nếu mở tập tin để ghi, trường hợp tập tin đã tồn tại rồi thì tập tin sẽ bị xóa và một tập tin mới được tạo ra. Nếu ta muốn ghi nối dữ liệu, ta phải sử dụng chế độ “a”. Khi mở với chế độ đọc, tập tin phải tồn tại rồi, nếu không một lỗi sẽ xuất hiện.

Kết thúc file

Sau khi tạo xong một file văn bản, đóng file này, byte mang giá  trị 1Ah (26 của hệ 10 – tương đương với khi gõ tổ hơp phím Ctrl + Z) sẽ tự động chèn vào cuối file để ấn định hết file.

Nói chung, file được quản lý bằng kích thước của file (số bytes). Khi đã đọc hết số byte có trong file, thì dấu kí hiệu EOF (end of file) được DOS thông báo cho chương trình. Dấu hiệu EOF là tên hằng mà C khai báo sẵn trong thư viện STDIO.H và nó mang giá trị  –1.

Như vậy, nếu một file dữ liệu (có cả số) được mở dạng văn bản, nếu trong giữa file mà có giá trị 1Ah thì quá trình đọc sẽ bị ngưng nửa chừng (hàm đọc file sẽ trả về giá  trị –1 cho chương trình báo đã kết thúc file).

 

Chỉ định file ở chế độ Dữ liệu trong chương trình C Được lưu trữ trên file
Văn bản „\n‟

EOF

CR (13), LF (10) 1Ah
Nhị phân „\n‟

„\r‟„\n‟

1Ah (số)

LF

CR LF

1Ah

Sự tương ứng giữa dữ liệu trong chương trình C và dữ liệu trên file

Đóng tập tin

Hàm fclose() được dùng để đóng tập tin được mở bởi hàm fopen(). Hàm này sẽ ghi dữ liệu còn lại trong vùng đệm vào tập tin và đóng lại tập tin.

Cú pháp: int fclose(FILE *f) 

Trong đó f là con trỏ tập tin được mở bởi hàm fopen(). Giá trị trả về của hàm là 0 báo rằng việc đóng tập tin thành công. Hàm trả về EOF nếu có xuất hiện lỗi.

Ngoài ra, ta còn có thể sử dụng hàm fcloseall() để đóng tất cả các tập tin lại.

Cú pháp: int fcloseall() 

Kết quả trả về của hàm là tổng số các tập tin được đóng lại. Nếu không thành công, kết quả trả về là EOF.

Kiểm tra đến cuối tập tin hay chưa?

Cú pháp: int feof(FILE *f) 

Ý nghĩa: Kiểm tra xem đã chạm tới cuối tập tin hay chưa và trả về EOF nếu cuối tập tin được chạm tới, ngược lại trả về 0.

Trả về             -1           :  Đã hết file

0           :  Chưa hết file

Số nguyên khác  :   Mô tả lỗi

Di chuyển con trỏ tập tin về đầu tập tin

Hàm rewind() – Chuyển về đầu tập tin, sử dụng hàm rewind().

Cú pháp: void rewind(FILE *f);

f: con trỏ tập tin đang thao tác.

Chuyển đến vị trí bất kỳ sử dụng hàm fseek().

Cú pháp: int fseek(FILE *stream, long offset, int whence);

+ stream: con trỏ tập tin đang thao tác.

+ offset: số byte cần dịch chuyển con trỏ tập tin.

+ whence: vị trí bắt đầu để tính khoảng cách dịch chuyển cho offset:

0 SEEK_SET Vị trí đầu tập tin
1 SEEK_CUR Vị trí hiện tại của con trỏ tập tin
2 SEEK_END Vị trí cuối tập tin

+ Kết quả trả về của hàm là 0 nếu việc di chuyển thành công. Nếu không thành công, 1 giá trị khác 0 (đó là 1 mã lỗi) được trả về.

Lấy vị trị của con trỏ file hàm ftell();

Cú pháp: long ftell(FILE *stream);

+ stream: biến đại diện cho file

+ trả về vị trí của con trỏ file so với đầu file

Quy trình xử lý File

Bước 1: Mở file.

  • Xác định chế độ mở chính xác(text/binary).
  • Kiểm tra lỗi.

Bước 2: Truy xuất xử lý.

  • Áp dụng hợp lý các hàm truy xuất tùy theo chế độ mở.
  • Quản lý con trỏ chỉ vị trí.
  • Kiểm tra lỗi.

Bước 3: Đóng file nhằm đảm bảo tính toàn vẹn dữ liệu.

LEAVE A REPLY