Thứ tư, 17/07/2024

Tìm kiếm

Giới thiệu chung
Đại hội VAIP IX
Hoạt động hội
Tin tức ICT
Môi trường - Chính sách
Doanh nghiệp - Hội viên
Sản phẩm - Công nghệ
Giao thương
Nguồn lực cho CNTT
Phần mềm nguồn mở
Xã hội ICT
Gặp gỡ ICT đầu xuân
Hội thảo HT-PT
ICT Caravan 2023
Lịch sử tin học Việt Nam
Chương trình hành động
Hội viên
ICT Tennis
Kỷ yếu 30 năm OLP
Liên hệ
  Cập nhật: 28/09/2015
Thêm một kho cơ sở dữ liệu tiếng Việt sẽ ra mắt cuối năm 2015

Kho từ này sẽ làm cở sở trong việc xử lí tiếng Việt bằng máy tính như dịch máy, phân tích văn bản tự động, tóm tắt văn bản tự động, tìm kiếm thông tin, v.v.

Các ứng dụng công nghệ hiện nay như nhận dạng tiếng nói, tổng hợp tiếng nói, tìm kiếm thông tin, phân loại văn bản tự động, trích rút thông tin tự động, tóm tắt văn bản tự động, dịch tự động… đều cần một kho cơ sở dữ liệu để từ đó phát triển thêm lên.

Tại Việt Nam, để xử lí ngôn ngữ tiếng Việt, các nhà khoa học máy tính chủ yếu dựa vào các kho ngữ liệu là VietTreebank, Từ điển VCL (Vietnamese Computational Lexicon), một số từ điển tiếng Việt...

Vào cuối năm 2015, dự án Wordnet – một kho dữ liệu tiếng Việt – sẽ hoàn thành, bổ sung thêm một lựa chọn so với các kho dữ liệu tiếng Việt kể trên.

Trang chủ dự án Wordnet - Ảnh chụp màn hình

Mạng từ tiếng Việt Wordnet (wordnet.vn) là một trong những sản phẩm chính của đề tài nghiên cứu khoa học cấp Nhà nước Nghiên cứu, xây dựng và phát triển một số tài nguyên và công cụ thiết yếu cho xử lí văn bản tiếng Việt, mã số KC.01.20/11-15, thuộc chương trình KC.01/11-15 do do Bộ Khoa học và Công nghệ quản lí và Công ty Cổ phần Dịch vụ Công nghệ Thông tin Naiscorp chủ trì thực hiện.

Mạng từ tiếng Việt là một cơ sở dữ liệu từ vựng tiếng Việt được xây dựng theo mô hình Mạng từ tiếng Anh (WordNet) – ra đời từ cuối những năm 1980. Kho dữ liệu này gồm ba nhóm từ loại chính là danh từ, động từ và tính từ; dự định gồm 30.000 loạt đồng nghĩa, với 50.000 đơn vị từ vựng, trong đó có 30.000 đơn vị từ vựng là từ tiếng Việt thông dụng.

Theo Ictnews.vn

  Trang trước    | Về đầu trang
Bình luận - Comment (FB):
tin hoc doi song
Công ty cổ phần Minh Việt
hanoi
Hiệp hội doanh nghiệp điện tử Việt Nam
automation
technoaid
Dự báo thời tiết
  Powered and Designed by MinhViet Technology Group
HỘI TIN HỌC VIỆT NAM
Người chịu trách nhiệm nội dung: Ông Nguyễn Long - Tổng Thư Ký - Hội Tin Học Việt Nam
Head office: 6th floor, 14 Tran Hung Dao Str., Hanoi,Vietnam - Tel:84-24-38211725 - Fax:84-24-38211708 - Email: office@vaip.vn
Copyright 2003-2006 by VAIP. All rights reserved
Designed by InteCom (MinhViet JSC) - Powered by MVC-Web CMS 2.0