Microsoft Cognitive Services on Azure – Computer Vision

0

Hiểu một cách đơn giản, Microsoft Cognitive Services bao gồm một bộ các API ứng dụng trí tuệ nhân tạo thông minh, cho phép lập trình viên ở mọi cấp độ có thể tạo ra được những ứng thông minh một cách dễ dàng.

Để có thể sử dụng bộ API này, bạn có thể đăng ký gói Azure để tiếp cận. Nếu là sinh viên và đang sở hữu email trường, bạn có thể thử đăng ký gói Azure for Students để tiếp cận công nghệ mới này một cách miễn phí.

Hoặc nếu không, bạn có thể dùng thẻ thanh toán quốc tế để đăng ký tài khoản dùng thử trong vòng 1 tháng.

Bài viết đầu tiên mở màn cho loạt bài Microsoft Cognitive Services on Azure hôm nay, ta sẽ tìm hiểu về dịch vụ Computer Vision. Minh họa trong bài viết là ứng dụng Analyze Image.

Bước 1: Nhấn vào Create a resource ở góc trên bên trái.
Chọn vào AI + Cognitive Services. Sau đó chọn See all ở màn hình Featured.
Trong đây, bạn kéo xuống dưới cùng, chọn More ở mục Cognitive Service.
Chọn Computer Vision API. Tiếp tục, nhấn vào nút Create ở màn hình mới bên phải.
Tiếp theo, thiết lập các thông số như Name, Location, Pricing tier và Resouce group. Nhấn vào Pin to dashboard nếu muốn tạo shortcut truy cập nhanh. Xong tất cả, bạn nhấn vào Create để tạo dịch vụ.
Quá trình khởi tạo diễn ra trong khoảng 1 phút.
Sau khi hoàn tất, bạn vào giao diện của dịch vụ và chọn Keys ở mục 1 – Grab your keys.
Nhấn biểu tượng copy ở 1 trong 2 key được tạo ra.
Nhấn vào Computer Vision API references ở mục 2.
Trong cửa sổ mới, bạn kéo xuống dưới mục Analyze Image và chọn Region thích hợp với nơi bạn đang ở.
Tiếp tục, thiết lập các thuộc tính cơ bản để chương trình xử lý với hình ảnh mà bạn sẽ nạp vào.
Dán key đã copy ở trên vào mục Ocp-Apim-Subscription-Key.
Để sử dụng, bạn dán 1 link hình ảnh tùy chọn vào trong mục Input requirements như hình.
Sau khi nhấn Send ở bước trên, API sẽ phân tích hình ảnh đầu vào và cho ra kết quả phân tích. Ta thấy ở đây kết quả không xác định được tên người trong hình, chỉ ước đoán được số tuổi và đúng được giới tính.
Tôi thử lại với bức hình chân dung của Bill Gates, kết quả là chương trình nhận diện được cả kiểu hình ảnh (people_portrait), tên nhân vật, giới tính. Tuy nhiên, số tuổi mà chương trình xác định không đúng (tuổi thực là 62 còn trong kết quả phân tích là 70).

Như vậy, trên đây tôi đã demo được cách đăng ký dịch vụ của Microsoft Cognitive Services trên môi trường Azure. Đồng thời, ta hiểu được cách dùng căn bản của API Computer Vision như thế nào.

Ở các bài tiếp theo, ta sẽ tiến hành code chương trình có giao diện để xử lý, thay vì sử dụng web console như vầy, vốn rất bất tiện nếu cần xử lý dữ liệu số lượng lớn.

Bên cạnh API Computer Vision, ta còn có thể dùng thử Text Analytics API, giúp nhận diện chữ và trích xuất ra từ hình ảnh đầu vào. Tôi đã có viết một chương trình dạng web minh họa và host trên máy chủ – cũng dùng của Azure. Bạn có thể dùng thử tại địa chỉ:

http://20.188.102.125/

Để hiểu rõ cách làm, bạn tham khảo video dành riêng cho bài này:

 

VÕ TÌNH THƯƠNG

votinhthuong9@gmail.com

LEAVE A REPLY