Hotline: 098 821 7749 info@acinternational.com.vn
Mã SP: DEV - 024
Dynamsoft Label Recognizer
Giá:liên hệ Còn hàng
Số lượng:

Dynamsoft Label Recognizer

Hãng sản xuất Dynamsoft Label Recognizer Phiên bản: Latest Version
Bản quyền Subcription hoặc Perpetual (Tùy chọn)
Thời hạn bản quyền Vĩnh viễn hoặc Hàng năm (Tùy chọn)
Ngành nghề Lập trình
Đối tượng tác động Code

Mô tả

Dynamsoft Label Recognizer (DLR) là SDK thu thập dữ liệu được thiết kế để nhận dạng vùng văn bản hoặc ký hiệu có ý nghĩa trong hình ảnh (hoặc 'Nhãn - Label' trong ngữ cảnh này). Một số tình huống phổ biến mà một thành phần như DLR có thể tỏ ra hữu ích bao gồm MRZ hộ chiếu, thẻ ID, thẻ giá trong siêu thị, nhãn hàng tồn kho trong kho, mã VIN trên kính chắn gió ô tô, giấy phép lái xe, v.v.
Thông tin liên hệ:

Liên hệ với tôi qua:

Thông tin chi tiết sản phẩm

Phiên bản >>

Dùng thử >>

HDSD >>

Yêu cầu hệ thống >>

Xuất xứ >>

Mô tả: ​Dynamsoft Label Recognizer (DLR) là SDK thu thập dữ liệu được thiết kế để nhận dạng vùng văn bản hoặc ký hiệu có ý nghĩa trong hình ảnh (hoặc 'Nhãn - Label' trong ngữ cảnh này). Một số tình huống phổ biến mà một thành phần như DLR có thể tỏ ra hữu ích bao gồm MRZ hộ chiếu, thẻ ID, thẻ giá trong siêu thị, nhãn hàng tồn kho trong kho, mã VIN trên kính chắn gió ô tô, giấy phép lái xe, v.v.


Tổng quan về phần mềm


Dynamsoft Label Recognizer

Localize and Extract Key Data from Specified Region using OCR



SDK nhận dạng và phát hiện văn bản sẵn sàng cho doanh nghiệp


Dynamsoft Label Recognizer SDK sử dụng OCR để đọc các ký tự chữ và số và ký hiệu tiêu chuẩn từ hình ảnh có màu nền, phông chữ hoặc kích thước văn bản khác nhau. Không giống như OCR truyền thống, trình nhận dạng nhãn của chúng tôi được thiết kế để phân tích văn bản không tuân theo các quy tắc ngôn ngữ tự nhiên. Trình nhận dạng nhãn Dynamsoft có thể được tùy chỉnh cho các mẫu ký tự và ký hiệu cụ thể như thẻ ID, nhãn hàng tồn kho, thẻ giá, mã VIN ô tô và biển số xe.


MRZ Passports và ID Cards


Các thiết bị thông minh được trang bị phần mềm và công nghệ OCR giúp nhân viên sân bay và hãng hàng không quét thẻ căn cước và hộ chiếu mà máy có thể đọc được một cách dễ dàng và ngay lập tức.


HÃY THỬ BẢN DEMO TRỰC TUYẾN MRZ SCANNER CỦA Dynamsoft >

Lot No. trên chai thuốc 


Việc kết hợp các công nghệ thu thập dữ liệu và nhận dạng văn bản vào phần mềm chăm sóc sức khỏe sẽ tăng thêm giá trị vượt trội cho các ứng dụng của họ.


TÌM HIỂU THÊM >

Nhãn bưu kiện trong vận tải và hậu cần


Công nghệ OCR giúp giảm thiểu sai sót, năng lượng và thời gian liên quan đến quy trình nhập dữ liệu thủ công trong ngành vận tải và hậu cần.


TÌM HIỂU THÊM >


Dynamsoft Label Recognizer (DLR) hỗ trợ việc phát triển phần mềm của bạn thông qua các khía cạnh sau:


  • Giới thiệu tính năng vùng tham chiếu “Reference Region”  để giảm bớt khó khăn khi chỉ định Vùng quan tâm “Region of Interest (ROI)”.

  • Tạo khái niệm Vùng suy luận “Inference Area” để tính toán hiệu quả vị trí nhãn mục tiêu bằng cách sử dụng các đặc điểm vị trí tương đối cố định giữa các khối văn bản, đặc biệt đối với các cặp khóa-giá trị “key-value pairs”.

  • Công cụ nhận dạng văn bản cải tiến kết hợp các ưu điểm của mô hình Mạng thần kinh chuyển đổi “Convolutional Neural Network (CNN)” và trích xuất đặc điểm hình ảnh truyền thống.

  • Hỗ trợ các biểu thức chính quy có thể mở rộng để cải thiện độ chính xác của nhận dạng văn bản.

  • Sử dụng nhiều chế độ xử lý khác nhau ở các giai đoạn khác nhau của thuật toán để duy trì khả năng mở rộng cao.

  • Với DLR, bạn có thể tạo phần mềm nhận dạng và phát hiện văn bản có thể tùy chỉnh với hiệu suất cấp doanh nghiệp để đáp ứng nhu cầu kinh doanh của bạn.


OCR Comparison

Dynamsoft Label Recognition

Document OCR

Tối ưu hóa để nhận dạng

Văn bản thưa và ngắn, đôi khi là số và ký tự ngẫu nhiên để máy đọc

Văn bản dày đặc, chủ yếu là ngôn ngữ tự nhiên

Mục tiêu “Target”

Hình ảnh như nhãn sản phẩm, bảng giá, CMND, thẻ

Tài liệu toàn trang

Mục đích “Purpose”

Trích xuất dữ liệu có ý nghĩa được cấu trúc và bán cấu trúc

Chuyển đổi hình ảnh thành văn bản để lưu trữ và tìm kiếm

Bản địa hóa “Localization”

Sử dụng các vùng tham chiếu để định vị văn bản có ý nghĩa, chẳng hạn như bên dưới mã vạch hoặc trong hình chữ nhật màu vàng

Tất cả các văn bản trong tài liệu đều được quan tâm

Sự công nhận

Regex tùy chỉnh để đảm bảo độ chính xác

Giải thích và phân tích ngữ pháp các cụm từ bằng cách sử dụng từ điển để cải thiện độ chính xác



Các ngôn ngữ lập trình và hệ điều hành được hỗ trợ


  • Dynamsoft Label Recognizer SDK hỗ trợ các nền tảng chính (Windows, Linux, iOS và Android) với các giao diện C/C++, C#, Objective-C/Swift và Java.


Khả năng tùy chỉnh đặc biệt

Nhận được nhiều hơn từ hình ảnh của bạn.


Chỉ định một vùng cho văn bản OCR bằng vùng tham chiếu “reference region”

Thuật toán tiền xử lý hình ảnh “image pre-processing algorithms” tinh vi

Sử dụng biểu thức chính quy để cải thiện độ chính xác và độ tin cậy

Ghép kết quả nội dung từ các khung hình video lân cận



Các tình huống sử dụng - Usage Scenarios


Thẻ căn cước khi đi máy bay


  • Các thiết bị thông minh được trang bị phần mềm OCR dựa trên DLR giúp nhân viên trong ngành hàng không quét thẻ căn cước và hộ chiếu mà máy có thể đọc được một cách dễ dàng. Hành khách có thể scan hộ chiếu khi làm thủ tục trực tuyến, từ đó loại bỏ sai sót khi nhập dữ liệu và phản hồi các cảnh báo như hộ chiếu hết hạn.

Quét số VIN


  • Số nhận dạng phương tiện (VIN) là một trong những thông tin quan trọng nhất thường được sử dụng trong ngành công nghiệp ô tô, thường là để nhận dạng phương tiện. Với sự trợ giúp của DLR, người dùng có thể xác định bất kỳ chiếc xe nào ở bất cứ đâu, bất cứ lúc nào bằng cách quét số VIN.

Bán lẻ


  • Trong bán lẻ, DLR có thể giúp đảm bảo nhận dạng nhãn giá nhanh chóng và chính xác, cho dù đó là nhiều nhãn giá cùng một lúc hay chỉ một nhãn. DLR không phụ thuộc vào mã vạch liên quan của nhãn giá như đầu đọc mã vạch Barcode Reader, vì vậy nhân viên bán lẻ vẫn có thể sử dụng tính năng nhận dạng nhãn để thực hiện xác minh giá.

Quản lý hàng tồn kho và kho bãi


  • Nhân viên trong kho có thể sử dụng DLR để quản lý hàng tồn kho. Ngay cả khi mã vạch bị hỏng, bạn vẫn có thể dễ dàng nhận ra hàng tồn kho với sự trợ giúp của văn bản đi kèm để đảm bảo mọi thứ vẫn ở đúng vị trí.

Số Lot trên chai thuốc trong chăm sóc sức khỏe


  • Dựa trên DLR, chúng tôi có thể tích hợp công nghệ thu thập dữ liệu và nhận dạng văn bản vào phần mềm chăm sóc sức khỏe, tăng thêm giá trị vượt trội cho các ứng dụng của họ. Ví dụ: đối với các sản phẩm dược phẩm không có dữ liệu được mã hóa trong mã vạch, phần mềm OCR dựa trên DLR sẽ trợ giúp bằng cách quét ngay số ref hoặc số lô. DLR cũng có thể được sử dụng để nhận dạng nhân viên bằng cách quét huy hiệu ID (tên, số, v.v.) trên ngực nhân viên.

Theo dõi linh kiện và bảo trì


  • Phần mềm OCR được tích hợp với DLR giúp người vận hành bảo trì dễ dàng theo dõi và tìm thấy các bộ phận khác nhau trong kho. Giải pháp quét thiết bị thông minh được trang bị phần mềm OCR có thể dễ dàng thay thế phần cứng quét chuyên dụng góp phần giảm tổng chi phí sở hữu. Nhân viên có thể quét văn bản và mã vạch trên các bộ phận khác nhau, tiết kiệm thời gian trong quy trình và giảm nguy cơ xảy ra lỗi khi theo dõi một số lượng lớn bộ phận.

Nhãn bưu kiện trong vận tải và hậu cần


  • Công nghệ OCR giúp giảm thiểu sai sót và tiêu tốn thời gian liên quan đến quy trình nhập dữ liệu thủ công trong ngành vận tải và hậu cần. Với DLR, việc đọc nhãn hiệu, văn bản và bản in laser quang học trở nên dễ dàng hơn, sau đó có thể lập chỉ mục dữ liệu trong hệ thống tài liệu và điều phối. Khi mã vạch trên bưu kiện hoặc gói hàng bị hỏng, DLR có thể giúp bạn bằng cách đọc văn bản đi kèm. Phần mềm OCR nâng cao có thể quét nhiều dòng văn bản trong một lần quét.

Quét mã chứng từ


  • Với sự trợ giúp của DLR, các công ty có thể cho phép khách hàng quét mã phiếu thưởng ở mặt sau thẻ quà tặng bằng thiết bị di động của họ. Để đạt được điều này, các công ty cần tích hợp máy quét số sê-ri vào ứng dụng của họ. Đây sẽ là một cách tốt để thúc đẩy sự gắn kết với công ty.

Séc trong ngân hàng


  • Việc thu thập dữ liệu chính xác giúp đơn giản hóa các quy trình ngân hàng, giúp chúng hiệu quả hơn. Những cải tiến OCR gần đây cho phép khách hàng dễ dàng quét và gửi séc qua thiết bị di động của họ. Chữ ký, số tài khoản và tổng số tiền của khách hàng sẽ được kiểm tra. Số tiền trên séc được in bằng phông chữ đặc biệt có thể dễ dàng nhận ra bằng các thiết bị thông minh được trang bị phần mềm OCR dựa trên DLR.


Tính năng chi tiết


Nhận được nhiều thông tin hơn từ hình ảnh của bạn


Khám phá các tính năng có sẵn trong Dynamsoft Label Recognizer SDK để kiểm soát dữ liệu của bạn.



Extract and Recognize Characters from Various Image Formats - Trích xuất và nhận dạng ký tự từ các định dạng hình ảnh khác nhau

  • Dynamsoft Label Recognizer có khả năng đọc các ký tự chữ và số và ký hiệu tiêu chuẩn, bao gồm dấu chấm, dấu phẩy và dấu gạch ngang, với nhiều màu sắc, kích thước và kiểu phông chữ khác nhau.

  • Các định dạng hình ảnh được hỗ trợ bao gồm BMP, TIFF, JPEG, PNG và PDF.

Công cụ nhận dạng văn bản “Text Recognition Engine”


DLR đi kèm với một công cụ nhận dạng văn bản cải tiến giúp nó thu được kết quả nhận dạng văn bản một cách nhanh chóng và chính xác. Tính năng này kết hợp các ưu điểm của mô hình CNN (Mạng thần kinh chuyển đổi - Convolutional Neural Networks) và trích xuất tính năng hình ảnh truyền thống.


Công cụ nhận dạng văn bản của DLR hỗ trợ một mô hình chính và nhiều mô hình phụ trợ. Mô hình chính chủ yếu bao gồm chữ hoa và chữ thường, số, chữ số Ả Rập và một số dấu chấm câu. Mô hình chính được sử dụng theo mặc định khi không có bộ ký tự nào được chỉ định trong các tham số của DLR.


Thông thường, bộ ký tự càng nhỏ thì tỷ lệ nhận dạng sẽ càng cao. Trong quá trình nhận dạng lặp lại, DLR sẽ tự động chọn mô hình CNN (mô hình phụ trợ) nhỏ nhất theo bộ ký tự. Nếu không có bộ nào được chỉ định thì DLR sẽ đi cùng với mô hình chính. DLR áp dụng cách tiếp cận lặp lại đối với quá trình nhận dạng, do đó, khi kết quả nhận dạng ban đầu được tạo ra, DLR có thể chia chuỗi kết quả thành một vài phần, mỗi phần có bộ ký tự nhỏ hơn phần còn lại. Sau đó, DLR có thể tận dụng các bộ cụ thể này để cải thiện tỷ lệ nhận dạng bằng cách chọn các mô hình phụ trợ phù hợp.


Một trường hợp sẽ là nhãn chứa cả số và chữ cái nhưng chỉ có số ở một vị trí nhất định. Nếu DLR biết đến và có mô hình phụ trợ chỉ có số trong các thư mục, DLR sẽ tự động chọn mô hình chỉ có số để có kết quả tốt nhất.


Ngoài ra, DLR cũng hỗ trợ đào tạo tập dữ liệu để tạo các mô hình nhận dạng tùy chỉnh. Trong một số trường hợp, vẫn có thể đọc sai một số ký tự nhất định. Sau đó, những đặc điểm hình ảnh truyền thống của từng ký tự sẽ được ghi lại để phân biệt rõ ràng hơn.



Specify an Area to OCR Text Using a Reference Region - Chỉ định một vùng nhận diện văn bản OCR bằng vùng tham chiếu

Dynamsoft Label Recognizer không phải nhận dạng văn bản từ hình ảnh có kích thước đầy đủ. Người dùng có tùy chọn chạy tính năng nhận diện OCR vùng cho vùng văn bản. SDK OCR cho phép bạn chỉ định vị trí tương đối của văn bản với vùng tham chiếu.


  • Ví dụ: thẻ trong kho, nơi văn bản quan tâm luôn ở bên trái và bên phải của mã vạch. Tọa độ của mã vạch có thể được sử dụng để xác định vị trí tương đối của vùng văn bản. Việc có thể chỉ định điều này rất hữu ích vì nó tăng tốc độ nhận dạng quét hơn nữa và cải thiện độ chính xác của nhận dạng.

  • Một ví dụ khác là thẻ giá, trong đó văn bản quan tâm luôn nằm trên nền hình vuông màu vàng. Trong trường hợp này, hình vuông màu vàng có thể đóng vai trò là vùng tham chiếu.


Vùng tham chiếu “Reference Region” là gì?


Vùng tham chiếu “Reference Region” là tính năng quan trọng nhất của DLR. Nói chung, nhãn không cố định ở một vị trí nhất định, nhưng chúng ta có thể sử dụng một số khu vực đặc trưng xung quanh nhãn mục tiêu để xác định vị trí của nó. Vùng tham chiếu có thể sử dụng các đặc điểm xung quanh như màu nền foreground và background colours, đường thẳng, họa tiết hoặc mã vạch xung quanh nhãn để chỉ định cụ thể hóa Vùng quan tâm “Region of Interest (ROI)”.


Vùng tham chiếu có thể là:


  • Vùng được xác định trước dựa trên tọa độ tuyệt đối hoặc tương đối được biết trước.

  • Một vùng mã vạch

  • Vùng được phát hiện trước dựa trên màu nền background colour, foreground colour v.v.

Vị trí của nhãn (còn gọi là vùng văn bản “text area”) được xác định bằng tọa độ phần trăm so với vùng tham chiếu. Mối quan hệ giữa vùng tham chiếu và nhãn được thể hiện trong hình bên dưới.


Hình 1 - Định nghĩa vùng tham chiếu ROI


Phần bên trái của hình minh họa trên chỉ cách xác định vị trí của vùng tham chiếu bằng vùng mã vạch. Mã vạch có thể được bản địa hóa và nhận dạng thông qua Dynamsoft Barcode Reader. Ngoài ra, nếu có nhiều mã vạch trong một hình ảnh, chúng tôi có thể xác định thêm vùng mã vạch mục tiêu bằng cách chỉ định (các) định dạng mã vạch và văn bản mã vạch.


Ở bên phải, chúng tôi trình bày cách SDK có thể xác định vùng tham chiếu dựa trên màu nền “background colour”. Trong trường hợp này, DLR được thông báo (thông qua API) rằng màu nền là màu đỏ và đến lượt nó, nó tự động xác định vùng tham chiếu thông qua các thuật toán của nó



Vùng suy luận “Inference Area” là gì?


Tính năng Vùng suy luận “Inference Area” trong DLR dựa trên đặc điểm vị trí tương đối giữa các khối văn bản trong hình ảnh. Nó sẽ được giới thiệu trong phiên bản 2.0 để giúp bạn tính toán vị trí nhãn mục tiêu một cách nhanh chóng và hiệu quả.


Như được hiển thị trong hình bên dưới, khối văn bản L0 và Nhãn T1 bên trong nhãn T0 tạo thành một cặp khóa-giá trị.


Hình 2 – Vùng suy luận dựa trên văn bản


T0 không chỉ là nhãn mà còn là vùng suy luận với các tham số suy luận phù hợp. DLR có thể tìm dòng văn bản L0 có cùng tọa độ dọc với T0, sau đó tính toán tọa độ tham chiếu chính xác hơn của nhãn đích T1.



Use a Regular Expression to Improve Accuracy and Robustness - Sử dụng biểu thức chính quy để cải thiện độ chính xác và độ mạnh mẽ

Nhà phát triển cũng có thể chỉ định Biểu thức chính quy để cho Dynamsoft Label Recognizer biết giả định về văn bản. Ví dụ: số VIN ô tô có một số chữ số cố định và mỗi chữ số có một số giá trị nhất định để lựa chọn. Mặc dù Dynamsoft Label Recognizer thường có thể quét chính xác tất cả các chữ số nhưng một số môi trường khó khăn có thể gây trở ngại. Vì vậy, ngữ nghĩa của Biểu thức chính quy, để chỉ định các giá trị chữ và số dự kiến ​​sẽ được quét, có thể cung cấp cho Dynamsoft Label Recognizer nhiều ngữ cảnh hơn để có kết quả OCR tốt hơn.

Sau khi OCR kết thúc, Biểu thức chính quy cũng có thể được sử dụng để xác minh và lọc ra các văn bản không được quan tâm. Các nhà phát triển cũng có thể sử dụng mô hình ký tự để hạn chế khả năng sử dụng chữ và số hoặc ký hiệu. Ví dụ: bạn có thể chỉ định số, kết hợp số và chữ cái, phông chữ cụ thể, ký tự đặc biệt, v.v.

Biểu thức chính quy có thể mở rộng “Extensible Regular Expressions”


Để cải thiện độ chính xác của nhận dạng văn bản, DLR hỗ trợ các biểu thức chính quy có thể mở rộng để sửa các ký tự bị nhận dạng sai.


Sử dụng kết quả khớp, DLR sẽ thực hiện phân tích phân đoạn để tìm ra vị trí chính xác không khớp với biểu thức chính quy. Sau đó, DLR cố gắng giảm kích thước của bộ ký tự được sử dụng để nhận dạng càng nhiều càng tốt thông qua kết quả khớp một phần.


Cuối cùng, DLR sẽ thực hiện nhiều lần lặp lại để sửa các ký tự bị nhận dạng sai thông qua nhiều phương pháp khác nhau như mô hình phụ trợ hoặc các tính năng ký tự.



Sophisticated Image Pre-Processing Algorithms - Thuật toán tiền xử lý hình ảnh tinh vi

Đối với hình ảnh có chất lượng kém, các thuật toán phức tạp được tích hợp trong Dynamsoft Label Recognizer SDK sẽ được áp dụng để cải thiện độ tương phản, loại bỏ nhiễu, v.v. Các đặc điểm của văn bản cũng có thể được sử dụng để cải thiện chất lượng hình ảnh. Ví dụ, với các thuật toán, đường cong của văn bản có thể được sử dụng để sửa các hình ảnh bị méo.

Chế độ xử lý khác nhau “Various Processing Modes”


Để đối phó với các tình huống khác nhau, DLR cung cấp nhiều chế độ xử lý khác nhau ở mỗi giai đoạn của quy trình thuật toán để duy trì khả năng mở rộng cao.


Ví dụ: BinarizationModes cung cấp một số phương pháp nhị phân hình ảnh và RegionPre detectionModes cung cấp các phương pháp phát hiện trước khác nhau để giúp xác định vị trí vùng tham chiếu.


Các chế độ này có thể được định cấu hình không chỉ thông qua API mà còn thông qua mẫu cấu hình (dưới dạng tệp, chuỗi, JSON, v.v.). Hơn nữa, việc triển khai các chế độ này có thể được tùy chỉnh theo kịch bản của khách hàng để tích hợp liền mạch với dự án của khách hàng.



Stitch Content Results from Neighboring Video Frames - Ghép kết quả nội dung từ các khung hình video lân cận

Dynamsoft Label Recognizer SDK hỗ trợ đọc nội dung từ luồng video. Đối với một khung được chỉ định, SDK trích xuất văn bản bằng OCR và tham chiếu chéo kết quả với các khung lân cận để có độ chính xác có thể kiểm chứng. SDK cũng có thể quyết định một cách thông minh xem kết quả văn bản là khớp một phần hay toàn bộ và chồng lấp các kết quả một phần từ các khung tuần tự với nhau.




Nguồn: https://www.dynamsoft.com/label-recognition/overview/