Mục lục:
- Đây là cách thuật toán của Google hoạt động
- Tự động sửa có tính đến ngữ cảnh
- Có thể chúng ta sẽ thấy công nghệ này trên Pixel
Các nhà nghiên cứu từ Google và MIT đã phát triển một thuật toán tìm cách sửa các sai sót trong các bức ảnh góc rộng.
Bạn có thể thấy rằng khuôn mặt của một số người trông bị kéo căng, hơi bẹp hoặc có một số biến dạng trong ảnh. Mặc dù có thể do ít kỹ năng của nhiếp ảnh gia, nhưng sự thật là ảnh chụp bằng ống kính góc rộng từ thiết bị di động thường gây ra hiện tượng méo hình đối tượng hoặc người ở rìa ảnh.
Có nhiều phương pháp khác nhau cố gắng giải quyết vấn đề này, nhưng cho đến nay vẫn chưa có phương pháp nào hiệu quả như đề xuất mới của Google. Mặc dù có vẻ dễ sửa nhưng không phải vậy, vì nó yêu cầu chỉnh sửa cục bộ phức tạp không ảnh hưởng đến phần còn lại của các đối tượng trong ảnh.
Đây là cách thuật toán của Google hoạt động
Như các nhà nghiên cứu giải thích, thuật toán này phát hiện khuôn mặt và tạo ra một lưới cho phép tự động đảo ngược loại biến dạng này khi chụp ảnh với một góc rộng như được minh họa trong hình ảnh:
Chúng ta có thể nhận ra sự khác biệt khi áp dụng thuật toán này trong các hình ảnh sau. Đây là một bức ảnh tự sướng được chụp bằng ống kính góc rộng với trường nhìn 97 °.
Hình ảnh đầu tiên cho thấy sự biến dạng trên khuôn mặt và hình ảnh thứ hai cho thấy cách thuật toán khôi phục hình dạng khuôn mặt về trạng thái ban đầu.
Tức là, quá trình này được kích hoạt tự động khi sử dụng ống kính góc rộng, cung cấp sự hỗ trợ đặc biệt này cho khuôn mặt, nhưng không gây ra các thay đổi đối với phần còn lại của hình ảnh. Và tất nhiên, tốc độ tự động hiệu chỉnh này (khoảng 920 mili giây) khiến người dùng không thể phát hiện ra.
Theo các thử nghiệm mà họ đã thực hiện, thuật toán này hoạt động thành công trong phạm vi 70 ° đến 120 ° trong trường nhìn, bao gồm hầu hết các khả năng từ thiết bị di động.
Để tận dụng tiềm năng của thuật toán này, người dùng sẽ không phải thực hiện bất kỳ hành động nào hoặc kích hoạt bất kỳ chế độ máy ảnh đặc biệt nào. Chức năng này sẽ chỉ được thực hiện tự động khi phát hiện ra rằng ống kính góc rộng được sử dụng.
Tự động sửa có tính đến ngữ cảnh
Chúng ta có thể xem động lực của thuật toán này trong video sau:
Thuật toán tự động sửa có tính đến phần còn lại của các đối tượng xuất hiện trong cảnh, làm cho toàn bộ bối cảnh của bức ảnh trùng khớp. Kết quả là tự nhiên mà không có các chi tiết cho thấy rằng bức ảnh đã được chỉnh sửa.
Nhóm nghiên cứu đằng sau dự án này đã chia sẻ một thư viện ảnh trên Flickr cho thấy các phương pháp khác nhau giải quyết vấn đề này như thế nào so với động lực của thuật toán của họ. Có hơn 160 bức ảnh (như bức bạn thấy ở đầu bài viết) giúp chúng tôi đánh giá kết quả.
Có thể chúng ta sẽ thấy công nghệ này trên Pixel
Chúng tôi có thể hy vọng rằng thuật toán này hoặc một số công nghệ có nguồn gốc sẽ được áp dụng trong thế hệ Pixel tiếp theo, vì nhóm tham gia dự án này là nhân viên của Google.
Tuy nhiên, trong tài liệu họ đã chia sẻ, họ không hề đề cập gì đến nó. Những thử nghiệm đầu tiên về thuật toán đang hoạt động này đã thành công cho thấy một lần nữa tiềm năng của trí tuệ nhân tạo có thể cải thiện tính năng động của thiết bị di động và làm cho cuộc sống của người dùng dễ dàng hơn.
Vì không nghi ngờ gì nữa, việc có một động tương tự trong thiết bị di động của chúng tôi sẽ giúp tiết kiệm rất nhiều thời gian và công sức chỉnh sửa những biến dạng này trong ảnh.
