Theo Kate O’Neill, phóng viên công nghệ trang Wired, trào lưu này có thể là một trong những cách Facebook thu thập dữ liệu đào tạo máy móc về sự lão hóa của người dùng.
Những trào lưu hình ảnh vốn không quá nguy hiểm. Nhưng tôi nghĩ kịch bản về nhận dạng khuôn mặt là khả thi nhất để giải thích trào lưu “10 năm trước” trên Facebook dạo gần đây. Người dùng nên nắm được điều này để cân nhắc hơn khi chia sẻ dữ liệu cá nhân.
Kho dữ liệu gương mặt chính xác khổng lồ
Một số người chỉ trích thuyết âm mưu của tôi. Họ lập luận rằng những bức ảnh này đã và đang tồn tại trên mạng xã hội. Facebook có tất cả hình ảnh được đăng trên tài khoản cá nhân.
Trào lưu “10 năm trước” có thể nằm trong kế hoạch thu thập dữ liệu người dùng của Facebook. Ảnh: Wired.
Điều đó là đúng, Facebook có tất cả hình ảnh của người dùng. Nhưng với trào lưu ảnh “10 năm trước” lần này, người dùng được hướng dẫn đăng ảnh trước đây và hiện tại của họ với khoảng thời gian cụ thể là 10 năm.
Vì vậy, những hình ảnh này nói lên được thời gian cụ thể. Hơn hết chúng thường được người dùng đăng ở chế độ công khai.
Hãy tưởng tượng bạn muốn đào tạo một thuật toán nhận diện gương mặt về các đặc điểm liên quan đến tuổi tác và cụ thể hơn là quá trình lão hóa. Đầu tiên bạn cần nghĩ đến kho dữ liệu khổng lồ và chi tiết để đào tạo máy móc. Sẽ rất hữu ích nếu bạn có một kho dữ liệu hình ảnh nêu được sự thay đổi của con người trong khoảng thời gian cụ thể, 10 năm.
Facebook có thể khai thác bằng cách xem ngày đăng hay dữ liệu EXIF. Tuy vậy, loại dữ liệu này rất hỗn tạp. Người dùng có thể thường không tải lên Facebook hình ảnh theo đúng thời gian chụp bức ảnh. Một số hình ảnh được tải từ các nền tảng khác, chụp màn hình… dẫn đến dữ liệu EXIF không giá trị.
Bên cạnh đó, nhiều người dùng không để ảnh của cá nhân làm ảnh đại diện. Ảnh trên dòng thời gian lại đăng quá nhiều thứ không liên quan đến gương mặt. Chẳng hạn họ có thể đăng ảnh chú chó, một người bạn, nhân vật hoạt hình, mô hình trừu tượng…
Hashtag #10yearschallenge càng giúp việc thu thập dữ liệu dễ dàng hơn.
Nói cách khác, dữ liệu hình ảnh thu thập từ trào lưu “10 năm trước” rất sạch sẽ, đơn giản để dùng. Thậm chí, chúng còn được gắn hashtag.
Với trào lưu này, người dùng sẵn sàng chia sẻ chính xác hình ảnh vào đúng thời điểm chụp kèm theo mô tả chi tiết (ví dụ: tôi năm 2008 và tôi bây giờ), cũng như thêm các thông tin khác như chụp ở đâu, ai chụp, khoảnh khắc nào (ví dụ: bức ảnh Joe chụp tại Đại học ABC khi vừa nhập học…).
Đối với hình ảnh không có thật, các thuật toán nhận diện gương mặt tinh vi dẽ dàng loại bỏ chúng. Ví dụ, nếu bạn tải lên ảnh một con mèo cách đây 10 năm và ảnh người bạn để tham gia trào lưu ảnh 10 năm, cặp ảnh này sẽ bị thuật toán loại bỏ.
Đây không phải là trào lưu, trò chơi duy nhất lợi dụng sự ngây thơ của người dùng để thu thập dữ liệu. Vài năm gần đây, những ví dụ về trò chơi trên mạng xã hội và các trào lưu được thiết kế ra với mục đích này rất nhiều. Vụ trích xuất dữ liệu 70 triệu người dùng Facebook ở Mỹ được thực hiện bởi Cambridge Analytica là một ví dụ.
Sử dụng cho nhiều mục đích
Vậy ai đó lấy ảnh của bạn trên Facebook để đào tạo thuật toán nhận dạng gương mặt liệu có đáng lên án?
Câu trả lời là không. Theo một cách nào đó, điều này là không thể tránh khỏi. Tuy nhiên, điều đáng nói là cách mà những dữ liệu này được sử dụng. Dưới đây là ba trường hợp ví dụ cho việc những dữ liệu này được dùng.
Nhận diện gương mặt được sử dụng vào rất nhiều mục đích khác nhau.
Kịch bản tốt
Công nghệ nhận diện gương mặt, cụ thể là khả năng nhận diện thay đổi theo lứa tuổi có thể giúp tìm kiếm những đứa trẻ mất tích.
Năm ngoái, cảnh sát ở New Delhi, Ấn Độ đã tìm ra 3.000 đứa trẻ bị mất tích chỉ sau 4 ngày nhờ công nghệ nhận dạng gương mặt.
Trong trường hợp những đứa trẻ mất tích sau một thời gian dài khiến ngoại hình thay đổi so với lúc đầu, một thuật toán nhận diện gương mặt tiên tiến sẽ thực sự hữu ích.
Kịch bản trắng trợn
Nhận dạng gương mặt hỗ trợ cho quảng cáo nhắm mục tiêu. Quảng cáo kết hợp với sự thay đổi về tuổi tác hoặc dựa vào hình ảnh để đoán tuổi tác. Dựa vào phân tích tốc độ lão hóa của bạn, các công ty bảo hiểm và chăm sóc sức khỏe có thể từ chối bán hàng hoặc trả nhiều tiền hơn vì bạn già quá nhanh.
Kịch bản giám sát người dùng
Năm 2016, Amazon giới thiệu dịch vụ nhận dạng khuôn mặt theo thời gian thực. Họ bắt đầu bán các dịch vụ này cho các cơ quan thực thi pháp luật và chính phủ, chẳng hạn như các sở cảnh sát ở Orlando và Hạt Washington, Oregon.
Nhưng cảnh sát có thể sử dụng công nghệ này để theo dõi cả người không phạm tội, những người biểu tình hay người mà cảnh sát cho là phiền phức.
Điều này dẫn đến việc Liên minh Tự do Dân sự Mỹ yêu cầu Amazon ngừng bán dịch vụ này. Một phần của các cổ đông và nhân viên của Amazon cũng đã yêu cầu công ty tạm dừng dịch vụ này với lý do lo ngại về định giá và uy tín của công ty.
Bất kể nguồn gốc của trào lưu này là gì, người dùng cần hiểu biết hơn về dữ liệu cá nhân và cách trao dữ liệu đó cho các công ty công nghệ. Thông điệp lớn hơn là con người đang trở thành nguồn dữ liệu lớn cho hầu hết công ty công nghệ trên thế giới. Dữ liệu của chúng ta giúp các doanh nghiệp thông minh hơn và có lợi nhuận nhiều hơn.
Người dùng yêu cầu các công ty công nghệ đối xử tốt với dữ liệu của mình. Tuy vậy, chúng ta cũng cần đối xử tốt với dữ liệu của chính mình.
Theo Wired