Xem AI phát minh ra ngôn ngữ hình ảnh riêng của nó

Phác thảo là một phần quan trọng trong quá trình suy nghĩ của nhiều nghệ sĩ - một cách để xem, bằng cách thực hiện; Matisse nổi tiếng nói rằng vẽ là đặt một đường thẳng xung quanh một ý tưởng. Thật thú vị, một nghệ sĩ tính toán nhận thấy rằng một quá trình sáng tạo tương tự dường như áp dụng cho bộ não tổng hợp, cũng như bộ não của con người.

Ít nhất, đó là một cách để diễn giải tác phẩm của nghệ sĩ Tom White , một giáo sư thiết kế tính toán tại Trường Thiết kế Đại học Victoria. Mỗi bức vẽ trong loạt bài gần đây của White mô tả một vật thể hàng ngày khác nhau: một chiếc xe nâng. Một chiếc áo lót. Một chiếc bàn là. Được thực hiện trong một bàn tay lỏng lẻo, mạnh mẽ, các bản vẽ trông giống như những bản phác thảo vội vàng của một nghệ sĩ đang thử nghiệm sự trừu tượng. Nhưng hình ảnh của White không phải là tác phẩm của bất kỳ nghệ sĩ con người nào. Anh ấy đang thử nghiệm lật ngược quy trình sáng tạo, đặt AI vào vị trí của nghệ sĩ trong khi anh ấy chỉ đơn giản là giúp những cái gọi là “ Công cụ nhận thức ” thể hiện bản thân.

[Hình ảnh: Tom White lịch sự]

Hãy xem một bản vẽ quạt điện của Perception Engine. Đầu tiên, White cho thấy một bộ sưu tập mạng nơ-ron phức tạp với hàng nghìn hình ảnh của người hâm mộ. Được đào tạo về tất cả các hình ảnh quạt đó, hệ thống sau đó “phác thảo” mô tả của riêng mình về một chiếc quạt, thêm các nét vẽ rộng và đường nét chi tiết dựa trên kiến thức về quạt. “Một số mạng nơ-ron đồng thời di chuyển và đẩy hình vẽ về phía vật kính,” White giải thích trong một bài luận trên Medium , so sánh quá trình phác thảo với “bảng Ouija tính toán”.

Bản phác thảo cuối cùng của một chiếc quạt có thể trông rất trừu tượng đối với mắt người - hầu như không thể nhận dạng được đối với một số người. Nhưng đây là điểm phức tạp: Các mạng nơ-ron khác cũng phân loại một cách đáng tin cậy bản vẽ vô cùng tưởng tượng của hệ thống như một chiếc quạt. Nó gần giống như hệ thống tự động tạo ra ngôn ngữ hình ảnh của riêng nó. Đó là nghệ thuật của AI, dành cho AI.

“Sử dụng các công cụ tri giác sẽ đảo ngược mối quan hệ sáng tạo khuôn mẫu được sử dụng trong tương tác máy tính của con người,” White tiếp tục. “Thay vì sử dụng máy tính như một công cụ, mô-đun Hệ thống Bản vẽ có thể được coi là một công cụ đặc biệt mà mạng thần kinh tự điều khiển để tạo ra các đầu ra sáng tạo của riêng nó.” Trong khi thiết kế hệ thống, anh ấy nói thêm, "mạng nơ-ron là trọng tài cuối cùng của nội dung."

Với sự tài trợ không hoàn lại từ nhóm Nghệ sĩ và Trí tuệ Máy móc của Google, White đã sử dụng máy in Riso để biến mỗi bản phác thảo thành một bản in, mà anh ta bán trực tuyến để tài trợ cho quá trình này. Một loạt các bản in, có tiêu đề khéo léo là The Treachery của ImageNet , bao gồm các chú thích liên quan đến bức tranh mang tính biểu tượng của Magritte năm 1928, The Treachery of Images (Ceci n'est pas une pipe).

Công việc của White liên quan đến những ý tưởng đang được tranh luận sôi nổi trong học máy ngày nay. Mạng nơ-ron có thể rất tốt trong việc nhận thức và xác định những gì chúng nhìn thấy trong hình ảnh, nhưng chúng lại yếu theo những cách khác. Chẳng hạn, một sự bất thường nhỏ trong hình ảnh một chiếc quạt mà con người không bao giờ nhận ra, có thể khiến hệ thống nhầm tưởng rằng nó đang nhìn một quả bơ. Đây được gọi là “ví dụ về đối thủ ” và gần đây các nhà nghiên cứu đã chỉ ra rằng những trục trặc tưởng như vô hại này có thể gây ra các vấn đề an ninh nghiêm trọng trong một số tình huống . Việc tăng cường mạng nơ-ron chống lại các ví dụ đối nghịch này có thể phụ thuộc vào việc giúp họ nhận ra các khái niệm trừu tượng cấp cao hơn về các đối tượng mà họ nhìn thấy – thay vì chỉ nhận dạng chi tiết, cấp pixel.

Trong khi đó, Công cụ nhận thức của White đề cập đến những câu hỏi lớn hơn về cách máy móc “nhìn thấy” và do đó chúng suy nghĩ như thế nào, cho thấy rằng những hệ thống này có khả năng trừu tượng hóa và tư duy khái niệm. “Mối quan tâm lâu dài của tôi là thể hiện nhận thức và sử dụng các khái niệm nền tảng chung để hiểu cách hệ thống học máy hoạt động hoặc không có sự hiểu biết chung về các khái niệm mà chúng tôi nghĩ rằng chúng đang học,” anh nói với Co.Design . Nói cách khác, đây có thể không phải là một người hâm mộ - nhưng nếu AI nghĩ rằng đó là một người hâm mộ và mọi người cũng vậy, thì nó cũng có thể là như vậy.

Tìm kiếm Blog này

Các thiết kế mới

Xem AI phát minh ra ngôn ngữ hình ảnh riêng của nó

Nhận xét

Đăng nhận xét