Archive

Archive for October, 2012

Báo cáo seminar ngày 27/10/2012 (Phạm Huyền Trang và Đinh Thị Hương)

October 30th, 2012 No comments

(1) Phạm Huyền Trang: “Một mô hình dự báo thị trường chứng khoán dựa trên khai phá dữ liệu Tweeter”
+ Phân tích nội dung một số nghiên cứu liên quan, tập trung vào bài báo
[BMZ11] Johan Bollena, Huina Maoa, Xiaojun Zengb (2011). Twitter mood predicts the stock market, Journal of Computational Science 2 (2011): 1–8.
+ Ý tưởng về một mô hình áp dụng phân lớp bán giám sát SVM-kNN (hoăc EM) để dự báo phân cực chỉ số chứng khoán dựa trên cảm xúc.
+ Toàn văn báo cáo: TrangPH_ThesisReport_v1.0

(2) Đinh Thị Hương: “Một mô hình khai phá vai trò trên mạng xã hội Twitter”
+ Phân tích một số nghiên cứu liên quan, tập trung vào bài báo
[TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine for social media. WWW (Companion Volume) 2012: 1051-1060.
+ Ý tưởng về một mô hình khai phá vai trò trên mạng xã hội Twitter gồm hai thành phần ngoại tuyến và trực tuyến.
+ Toàn văn báo cáo: khaiphavaitro_twitter_HuongDT

 

Categories: Nghiên cứu, Seminar Tags:

Phát hiện sự kiện Y Sinh học dựa trên mô hình đồ thị: Một số tìm hiểu bước đầu (seminar 20/10/2012)

October 22nd, 2012 No comments

Báo cáo tiến độ nghiên cứu “Phát hiện sự kiện Y Sinh học dựa trên mô hình đồ thị: Một số tìm hiểu bước đầu” tại buổi seminar ngày 20/10/2012 do nhóm sinh viên K54: Phí Văn Thủy, Phạm Thanh Bình, Nguyễn Xuân Hùng, Phạm Thị Hồng trình bày qua khảo sát nội dung các tài liệu tham khảo:

[BFWH09]. Ekaterina Buyko, Erik Faessler, Joachim Wermter, Udo Hahn (2009). Event Extraction from Trimmed Dependency Graphs, BioNLP 2009 Workshop (Shared Task on Event Extraction): 19-27
[KWTY11]. Jin-Dong Kim, Yue Wang, Toshihisa Takagi and Akinori Yonezawa (2011) Overview of Genia Event Task in BioNLP Shared Task 2011, BioNLP Shared Task 2011 Workshop: 7-15
[BHGAPS09]. Jari Björne, Juho Heimonen, Filip Ginter, Antti Airola, Tapio Pahikkala, Tapio Salakoski (2009). Extracting Complex Biological Events with Rich Graph-Based Feature Sets, BioNLP 2009 Workshop (Shared Task on Event Extraction): 10-18
[PSOKA12]. Sampo Pyysalo, Pontus Stenetorp, Tomoko Ohta, Jin-Dong Kim and Sophia Ananiadou (2012),  New Resources and Perspectives for Biomedical Event Extraction, BioNLP 2012 Workshop:100-108.
Nội dung báo cáo: 201012_Trich chon su kien y sinh hoc dua tren do thi
Categories: Seminar, Tin tức Tags:

Phát hiện bùng nổ sự kiện trên mạng xã hội: Một số tìm hiểu bước đầu (seminar 20/10/2012)

October 21st, 2012 No comments

Báo cáo tiến độ nghiên cứu “Phát hiện bùng nổ sự kiện trên mạng xã hội: Một số tìm hiểu bước đầu” của nhóm sinh viên K54: Tiêu Thị Phương, Ngô Quang Hiểu; K55: Nguyễn Anh Vũ.
Mạng xã hội phản ánh nhiều khía cạnh của xã hội thực trong đó hiện tượng bùng nổ sự kiện trong mạng xã hội phản ánh sự kiện thực có ảnh hưởng lớn. Chủ đề phát hiện bùng nổ sự kiện trong mạng xã hội là chủ đê khoa học – công nghệ thời sự và nhận được sự quan tâm của nhiều nhóm nghiên cứu trên thế giới. Báo cáo tiến độ nghiên cứu của nhóm sinh viên trình bày một số tìm hiểu bước đầu về chủ đề nói trên.

Nội dung báo cáo: EventBurstsInSocialNetwork

Categories: Nghiên cứu, Seminar Tags:

Khai phá dữ liệu quá trình: Một số tìm hiểu bước đầu (Seminar 20/10/2012)

October 20th, 2012 No comments

Báo cáo tiến độ nghiên cứu “Khai phá dữ liệu quá trình: Một số tìm hiểu bước đầu”
K54: Phạm Văn Thắng, Đào Thủy Ngân; K55: Nguyễn Thế Hùng.

Khai phá dữ liệu quá trình (Process Mining) cung cấp phương tiện mới để cải tiến các quá trình trong một loạt lĩnh vực ứng dụng. Công nghệ mới nổi này có hai yếu tố chính. Thứ nhất, ngày càng nhiều sự kiện được ghi nhận cho phép phát hiện các thông tin chi tiết về lịch sử của các quá trình. Tuy nhiên, hầu hết các tổ chức lại chẩn đoán các tình huống để xây dựng các quá trình kinh doanh dựa trên sự tưởng tượng nhiều hơn là cái mà thực tiễn đã và đang diễn ra đã được ghi nhận về lịch sử các quá trình. Thứ hai, các nhà cung cấp công cụ Quản lý quy trình kinh doanh (Business Peocess Management: BPM) và Thông minh kinh doanh (Business Intelligence: BI) đã hứa hẹn nhiều về các phép lạ, tuy nhiên, những công cụ BPM và BI hiện vần chưa đáp ứng được kỳ vọng.
Khai phá dữ liệu quá trình là một chuyên ngành mới nổi nhằm cung cấp bộ công cụ toàn diện để cung cấp các hiểu biết dựa trên thực tiễn và hỗ trợ việc cải tiến quy trình. Chuyên ngành mới này được xây dựng dựa trên tiếp cận điều khiển quá trình theo mô hình và khai phá dữ liệu. Khai phá dữ liệu quá trình kết hợp tiếp cận mẫu (tri thức) đặc biệt (thường được biểu diễn dưới dạng một lưới Petri: Petri net) với tiếp cận khai phá dữ liệu hướng miền ứng dụng (Domain Driven Data Mining – DDDM) quản lý quy trình kinh doanh BPM.

Nội dung báo cáo: Process mining

Categories: Nghiên cứu, Seminar Tags:

Báo cáo tiến độ NCKH: Khai phá quan điểm trên dữ liệu Twitter

October 20th, 2012 No comments

Sinh viên trình bày: Vũ Trọng Hóa và Đào Quốc Vương
Nội dung:
– Giới thiệu Twitter và dữ liệu trên Twitter
– Trình bày một số phương pháp khai phá quan điểm trên dữ liệu Twitter

Download: Khai phá quan điểm trên dữ liệu Twitter.pptx

Categories: Seminar Tags:

Báo cáo kết quả nghiên cứu tại NII: Dự án PHENOMINER

October 19th, 2012 No comments

Người trình bày: Lê Hoàng Quỳnh và Trần Mai Vũ
Nội dung: Giới thiệu về thực thể Phenotype và các thực thể liên quan cũng như dự án PHENOMINER.
Bên cạnh đấy, trình bày chi tiết về nội dung và các kết quả của hai nghiên cứu:
– A HYBRID APPROACH TO FINDING PHENOTYPE CANDIDATES IN GENETIC TEXTS
– GENETIC DOCUMENT CLASSIFICATION USING LEARNING POSITIVE AND UNLABELED WITH GRAPH-BASED METHOD

Download file trình bày: NII Internship Program Report.pdf

Categories: Seminar Tags:

Nghiên cứu xác định vai trò trong mạng xã hội (Báo cáo tiến độ)

October 13th, 2012 No comments

Báo cáo tiến độ nhóm sinh viên nghiên cứu khoa học đề tài “Xác định vai trò trong mạng xã hội” (K54: Bùi Đình Luyến, Trần Thị Sim, Phạm Văn Thắng; K55: Phạm Ngọc Xuyên)
Xác định vai trò (Role Discovery) và ảnh hưởng (influence) trong mạng xã hội (social networks) nhằm tìm ra những thực thể (entity) có vai trò quan trọng, có ảnh hưởng lớn tới trạng thái của mạng xã hội. Chủ đề nghiên cứu có nhiều ứng dụng, trong đó có ứng dụng tìm nhóm k-khách hàng có ảnh hưởng lớn nhất để định hướng giới thiệu sản phẩm [CWY09].

Tài liệu tham khảo:

[ALTY12] Nitin Agarwal, Huan Liu, Lei Tang, Philip S. Yu: Modeling blogger influence in a community. Social Netw. Analys. Mining 2(2): 139-162 (2012).

[CWE07] Andrew McCallum, Xuerui Wang, Andrés Corrada-Emmanuel: Topic and Role Discovery in Social Networks with Experiments on Enron and Academic Email. J. Artif. Intell. Res. (JAIR) 30: 249-272 (2007).

[CWY09] Wei Chen, Yajun Wang, Siyu Yang: Efficient influence maximization in social networks. KDD 2009: 199-208 (2009).

 

Toàn văn báo cáo: BaoCaoTienDo13102012

Categories: Nghiên cứu, Seminar Tags:

Một số chủ đề KH-CN của KTLab giai đoạn 2012-2014

October 6th, 2012 No comments

Giai đoạn 2012-2014, KTLab tập trung vào một số chủ đề KH-CN sau đây:

– Tóm tắt đa văn bản
– Phát hiện vai trò & dự báo bùng nổ sự kiện trên mạng xã hội
– Khai phá dữ liệu văn bản Y Sinh học
– Khai phá dữ liệu quá trình
– Tích hợp dữ liệu và khai phá dữ liệu song song
– Một số hướng đề tài SVNCKH

 

Nội dung báo cáo: 061012_Mot so de tai 2012-2014

Categories: Nghiên cứu, Seminar Tags:

Danh sách bài báo khoa học do KTLab công bố trong năm 2012

October 4th, 2012 No comments

Dưới đây là danh sách (chưa đầy đủ) các bài báo khoa học do KTLab công bố trong năm 2012:

  1. [TLQ12] Thi-Ngan Pham, Le-Minh Nguyen, Quang-Thuy Ha (2012). Named Entity Recognition for Vietnamese documents using semi-supervised learning method of CRFs with Generalized Expectation Criteria, IALP 2012, Ha Noi, Vietnam, November 13-15, 2012 (in press)
  2. [QTTT12] Quang-Thuy Ha, Thi-Oanh Ha, Thi-Dung Nguyen, Thuy-Linh Nguyen (2012). Refining the Judgement Threshold to Improve Recognizing Textual Entailment Using Similarity, ICCCI 2012, Part II, LNAI 7654, pp. 335–344, Ho Chi Minh City, Vietnam, November, 2012.
  3. [AQLH12] Ali Rezaei Divroodi, Quang-Thuy Ha, Linh Anh Nguyen, and Hung Son Nguyen (2012). On C-Learnability in Description Logics, ICCCI 2012 , Ho Chi Minh City, Vietnam, November, 2012 ( in press)
  4. [QTLHA12] Quang-Thuy Ha, Thi-Lan-Giao Hoang, Linh Anh Nguyen, Hung Son Nguyen, Andrzej Szałas and Thanh-Luong Tran (2012). A Bisimulation-based Method of Concept Learning for Knowledge Bases in Description Logics, SoICT’2012:241-249, Ha Long, August 23-24, 2012.
  5. Thanh-Luong Tran, Quang-Thuy Ha, Thi-Lan-Giao Hoang, Linh Anh Nguyen, Hung Son Nguyen and Andrzej Szałas (2012). Concept Learning for Description Logic-based Information Systems, KSE2012:65-73, Da Nang, August 17-19, 2012.
  6. [MMSMX12] Mai-Vu Tran, Minh-Hoang Nguyen, Sy-Quan Nguyen, Minh-Tien Nguyen, Xuan-Hieu Phan (2012). VnLoc: A Real–time News Event Extraction Framework for Vietnamese, KSE’2012 :161-166, Da Nang, August 17-19, 2012.

 

Danh sách: KTLab_2011_2012

Categories: Nghiên cứu, Tin tức Tags:

Danh sách một số bài báo khoa học KTLab công bố năm 2011

October 3rd, 2012 No comments

Dưới đây là danh sách (chưa đầy đủ) các bài báo khoa học do KTLab công bố trong năm 2011:

 

  1. [PNLLS11] Xuan-Hieu Phan, Cam-Tu Nguyen, Dieu-Thu Le, Le-Minh Nguyen, Susumu Horiguchi, and Quang-Thuy Ha (2011). A Hidden Topic-Based Framework Towards Building Applications with Short Web Documents, IEEE Transactions on Knowledge and Data Engineering, 23(7): 961-976, July 2011 (SCI ).
  2. [HTMQ11] Huyen-Trang Pham, Tien-Thanh Vu, Mai-Vu Tran, Quang-Thuy Ha (2011). A Solution for Grouping Vietnamese Synonym Feature Words in Product Reviews, IEEE APSCC’2011: 503-508, Jeju, Korea.
  3. [HMNNQ11] Hoang-Quynh Le, Mai-Vu Tran, Nhat-Nam Bui, Nguyen-Cuong Phan, Quang-Thuy Ha (2011). An Integrated Approach Using Conditional Random Fields  for Named Entity Recognition and Person Property Extraction in Vietnamese Text, IALP 2011 :115-118, Penang, Malaysia.
  4. [DMTQ11] Duc-Trong Le, Mai-Vu Tran, Tri-Thanh Nguyen, Quang-Thuy Ha (2011). Co-reference Resolution in Vietnamese Documents Based on Support Vector Machines, IALP 2011: 89-93, Penang, Malaysia.
  5. [QTH11] Quang-Thuy Ha, Tien-Thanh Vu, Huyen-Trang Pham, Cong-To Luu (2011). An Upgrading Feature-based Opinion Mining Model on Product Reviews in Vietnamese, AMT’2011: 173-185, Lanzhou, China.
  6. [THC11] Tien-Thanh Vu, Huyen-Trang Pham, Cong-To Luu, Quang-Thuy Ha (2011). A Feature-based Opinion Mining Model on Product Reviews in Vietnamese, Studies in Computational Intelligence, (Semantic Methods for Knowledge Management and Communication): 23-33.
  7. [CH11] Cù Thu Thủy, Hà Quang Thụy (2011). Phát hiện tập mục dữ liệu sporadic không tuyệt đối hai ngưỡng mờ, Tin học và Điều khiển học, 27(2): 142-150.
  8. [CH11a] Cù Thu Thủy, Hà Quang Thụy (2011). Phát hiện tập mục dữ liệu sporadic tuyệt đối hai ngưỡng mờ, Kỷ yếu Hội thảo quốc gia lần thứ XII “Một số vấn đề chọn lọc của CNTT&TT”: 263-275, Hưng Yên, 8/2010.
  9. [HNN11] Hà Quang Thụy, Nguyễn Ngọc Hóa, Nguyễn Viết Thế, Lương Nguyễn Hoàng Hoa (2011). Mô hình giải pháp lọc nội dung hỗ trợ quản lý và đảm bảo an toàn – an ninh trên Internet, Chuyên san các công trình nghiên cứu, phát triển và ứng dụng CNTT & Truyền thông, V-1 (6/26): 260-270, 9-2011.
  10.  [TD11] Tien-Thanh Vu, Dat Quoc Nguyen (2011). A Vietnamese Information Retrieval System for Product-Price, GrC 2011: 691-696, HKaoh-siung, Taiwan

KTLab_2011_2012

Categories: Nghiên cứu, Tin tức Tags: