Có thể dạy Robot biết nói?

Con người học nói thế nào và liệu có thể dạy cho robot năng lực này? Để trả lời câu hỏi này, có nhà khoa học Mỹ đã giam gia đình mình trong ngôi nhà được lắp đặt kín hệ thống máy quay và ghi âm...

Ông bà Roy sống trong ngôi nhà sơn mầu vàng trên con phố nhỏ yên tĩnh tại khu dân cư thành phố Boston (Mỹ). Đó là cặp vợ chồng Mỹ trung lưu điển hình trong thời gian nuôi dạy hai con nhỏ: Con trai ba tuổi và con gái hai tuổi.

Ngôi nhà được lắp đặt dày đặc hệ thống camera và các tai nghe. "Việc đó thoạt đầu cũng gây cảm giác khó chịu, nhưng bây giờ thậm chí chúng tôi đã quên sự hiện diện của chúng" - TS Deb Roy, nhà nghiên cứu thuộc Massachusetts Instittute of Technology (MIT), nhân vật đã thiết kế dàn máy thuộc dạng trình diễn thực tế, để ghi lại từng giây phút cuộc sống của cậu con trai sinh tháng năm 2006.

Con người học nói thế nào và liệu có thể dạy cho robot năng lực này?Ảnh minh họa

Đoạn phim này không bao giờ xuất hiện trên màn ảnh nhỏ. Bởi nó không phải là trò giải trí, mà là thí nghiệm khoa học quan trọng do Media Lab, Phòng thí nghiệm công nghệ số của MIT thực hiện. Ở đó TS Deb Roy lãnh đạo nhóm chuyên gia chuyên về lĩnh vực nhận biết giọng nói và phân tích tin học ngôn ngữ. Họ dậy robot (người máy) tập nói và vì thế nhóm nghiên cứu quan tâm đến cách thức con người làm chủ tiếng nói.

Bằng cách nào trẻ sơ sinh tự trang bị cho mình năng lực gần như kỳ diệu này? Các chuyên gia tâm lý học và ngôn ngữ học đang nỗ lực tìm đáp án cho câu hỏi này thông qua việc quan sát phản ứng tương tác của trẻ nhỏ với cha mẹ chúng, thường trong môi trường phòng thí nghiệm. Thế nhưng đã vài năm một bộ phận chyên gia coi phương pháp này đã tách rời thực tế cuộc sống và chuyển sang hướng nghiên cứu đối tượng trong môi trường tự nhiên của chúng, tức tại gia đình.

Vậy thì tại sao không quay phim toàn bộ những năm đầu cuộc đời trẻ, để nắm bắt những nỗ lực phát âm đầu tiên và theo dõi từng ngày sự phát triển vốn từ của chúng?

Với tư cách người phụ trách nhóm, Deb Roy đã quyết định triển khai dự án này và ông đặt tên cho nó là Speechhome.

"Tôi nảy ra ý tưởng đó vào thời điểm tôi phát hiện ra thực tế: Robot của tôi không có khả năng phân biệt quả bóng với bất cứ đồ vật nào khác có hình tròn, trong khi trẻ sơ sinh mới vài tháng tuổi đã nhận ra sự khác biệt giữa chúng. Và tôi cho rằng, cần phải quay lại cách thức trẻ tự nhận biết những khái niệm đã được xác định trong mối quan hệ tương tác với môi trường, bố mẹ".

Mục đích của nghiên cứu là quan sát môi trường thưc thể và môi trường xã hội trẻ học nói, là sự ghi lại tiến bộ của trẻ giờ sau so với giờ trước, ngày sau so với ngày trước, để tạo ra mộ dạng ngân hàng dữ liệu có thể giúp tất cả chuyên gia nghiên cứu đề tài này. Đó là dự án khổng lồ, ít nhất từ góc độ thời gian diễn ra thí nghiệm và số lượng băng hình sẽ phải thực hiện.

"Đối với các chuyên gia ngôn ngữ, dự án có một chút gì đó có thể so sánh với công trình phát hiện bản đồ gien con người của các nhà sinh học - TS Roy hãnh diện bình luận - Thành công của dự án sẽ tạo điều kiện thuận lợi cho nỗ lực thiết kế robot sẽ có thể học nói theo cách tự nhiên, nhưng đồng thời cũng tạo điều kiện hình thành những chiến lược nhận biết và sửa chữa những rối loạn ngôn ngữ hiệu quả hơn".

10 giờ/ngày

TS Deb Roy nhanh chóng vấp phải khó khăn nghiêm trọng: Tìm đâu được gia đình chấp nhận sống suốt ba năm liền trong môi trường không khác gì trong lồng kính trong suốt? Tình cờ vài tháng sau đó Patel, với nhà khoa học có bầu... Cô ấy cũng quan tâm đến ngôn ngữ (là chuyên gia lĩnh vực điêu chỉnh âm thanh) và không phản đối, khi chồng rụt rè đưa ra dự định sử dụng chính đứa con tương lai của mình sắm vai một con thỏ thí nghiệm. Tuy nhiên vợ đặt điều kiện chủ yếu liên quan đến sự cần thiết tôn trọng đời tư. Đứa trẻ được duy trì yếu tố nặc danh, chỉ xuất hiện với tên giả Dwayne trong các bài viết và tài liệu nghiên cứu. Họ cũng thống nhất, gia chủ có thể tạm ngừng hoạt động của các thiết bị quay phim và ghi hình lắp đặt trong nhà - trường hợp có nhu cầu.

Vài tuần trước ngày vợ sinh con, nhà khoa học đã lắp đặt 11 camera và 14 tai nghe gắn vào các bức tường và trần nhà bao trùm tất cả vị trí, trừ toalét. Tất cả thiết bị này được kết nối bằng mạng dây cáp có độ dài hàng kilômét đến dàn máy vi tính đặt trong tầng hầm ngôi nhà và có nhiệm vụ ghi lại tấ cả hình ảnh và âm thanh trên đĩa cứng. Các công tắc được lắp dặt rải rác khắp căn hộ cho phép chủ nhà che giấu một số bộ phận, để giữ bí mật sinh hoạt vợ chồng thầm kín.

Việc ghi hình và ghi âm tung bình kéo dài 10 tiếng (đó là thời gian hoạt động của trẻ), mỗi thánh nhóm nghiên cứu thu thập lượng dữ liệu đồ sộ chứa đầy vài trăm đĩa DVD. Sau 36 tháng triển khai thí nghiệm của người ta đã lưu trữ trên các máy tính của MIT 90 ngàn giờ ghi hình video và 140 ngàn giờ ghi âm.

Đó là trung tâm nghiên cứu liên ngành hiếm thấy trên phạm vi thế giới, nơi các chuyên gia tin học, các kỹ sư công nghệ mới, các nhà sinh học và thậm chí cả các nghệ sĩ có thể làm việc hoàn toàn thoải mái để nghĩ ra những công nghệ cho tương lai. Chính tại đây, các chuyên gia đã nghiên cứu chế tạo máy tính rẻ tiền (giá 100USD) dành cho trẻ em Thế giới thứ Ba, nghiên cứu xe hơi chạy điện lắp ghép kích cỡ nhỏ như chiếc xe đẩy hàng tại các siêu thị, chân tay giả tự động hoặc các dụng cụ âm nhạc thông minh. Và tất nhiên, trong đó có robot.

Ripley là "robot trò chuyện" mà TS đã nhiều năm nghiên cứu. Nó là công cụ bao gồm cánh tay bằng kim loại được trang bị hai camera cùng "bộ não" ti n học có khả năng nhận biết môi trường xung quanh và hiểu được những mệnh lệnh phát ra bằng ngôn ngữ tự nhiên. "Đưa cho tôi đồ vật mầu xanh ở phía bên phải - nhà khoa học phát hiện. "Xin mời" - robot đáp lời, đồng thời nhẹ nhàng lấy chiếc cốc đúng mầu đặt trên bàn, giữa quả bóng mầu vàng và quả táo mầu đỏ.

Robot Ripley được chế tạo theo cách, để có thể học thuộc từ trong mối quan hệ với con người. Trí tuệ của Ripley không dừng lại ở mức độ liên tưởng hình hài đồ vật với tên của nó, nó còn có khả năng nhận biết các đặc tính thể chất và biểu tượng - nó biết trọng lượng gần đúng của táo và biết có thể ăn loại quả này hoặc dùng nó đá như quả bóng, rằng táo có thể có nhiều mầu sắc khác nhau.

Từ đầu tiên: "BaBa"

Tuy nhiên ưu tiên số một hiện nay của TS Deb Roy và nhóm nghiên cứu là hoàn thiện phần mềm, mà cả nhóm đã viết nhằm mục đích giải mã cả núi dữ liệu nghe nhìn đã thu gom được trong khuôn khổ dự án kéo dài ba tháng tại gia đình TS Roy.

Phần mềm mang tên Total Recall giống như việc sử dụng kỹ thuật dựng phim video điển hình, theo đó có thể xem từng cảnh riêng biệt trên màn hình. Nó cho phép mô tả nội dung các cuộc trò chuyện đã được thực hiện trong nhà, nhưng đồng thời cũng nhận dạng được những đồ vật cụ thể, ví như đồ chơi trẻ đã sử dụng và nhận ra những người có mặt, và thậm chí cả hướng họ nhìn.

Có thể bằng cách ảo như thế chỉ ra, cậu bé Dwayne đã làm gì suốt cả buổi chiều trong phòng - lăn lê bò toài trên giường và quanh thùng đồ chơi - và tính được, thí dụ nó mấy lần nhoài người nhặt quả bóng nhựa mầu xanh. Mỗi khu vực trong nhà vốn được chia ra từng phần riêng biệt (chậu rửa bát đĩa, tủ lạnh, ghế xa lông...) và máy tính sẽ nắm bắt những đoạn băng ghi âm gắn liền với hành động cụ thể, như "rửa bát đĩa" hoặc "pha cà phê".

Nhờ phần mềm Total Recall các nhà khoa học thuộc MIT có thể tái tạo cách thức Dwayne đã học nói từng từ cụ thể thế nào, bắt đầu từ đầu tiên - bath (tắm) được phát âm lúc 11 tháng tuổi. Họ đã xếp hàng loại âm tiết ngắn, khi cậu bé phát âm từ water (nước). Thoạt đầu nó nói baba, khi chỉ tay vào cốc nước trên bàn, phải sau vài phút, nói mới nói được đúng từ (water).

Cho đến giữa năm nay TS Deb Roy và các đồng nghiệp thuộc MIT đã hoàn thành khối lượng công việc khổng lồ với sự trợ giúp của phần mềm Total Recall, tuy nhiên chương trình dạy robot biết nói vẫn tiến triển chậm chạp, mặc dù đã lấp ló không ít dấu hiệu lạc quan.

Theo Đào Vĩnh Hà



Gửi bài tâm sự

File đính kèm
Hình ảnh
Words
  • Bạn đọc gửi câu chuyện thật của bản thân hoặc người mình biết nếu được cho phép, không sáng tác hoặc lấy từ nguồn khác và hoàn toàn chịu trách nhiệm trước pháp luật về bản quyền của mình.
  • Nội dung về các vấn đề gia đình: vợ chồng, con cái, mẹ chồng-nàng dâu... TTOL bảo mật thông tin, biên tập nội dung nếu cần.
  • Bạn được: độc giả hoặc chuyên gia lắng nghe, tư vấn, tháo gỡ.
  • Mục này không có nhuận bút.