Mozilla dự định thu thập dữ liệu duyệt web từ những người dùng Firefox theo cách bảo mật riêng tư để giúp các nhóm sản phẩm của Firefox cải tiến trình duyệt dựa trên dữ liệu.
Georg Fritzsche của Mozilla công bố thông tin về kế hoạch thu thập dữ liệu bổ sung ngày hôm qua trên nhóm Quản trị Mozilla. Trong đó, ông mô tả vấn đề mà các kỹ sư của Mozilla đang phải đối mặt. Mặc dù Firefox có thể thu thập dữ liệu khi người sử dụng chọn tham gia, nhưng Mozilla tin rằng dữ liệu là thiên vị và chỉ có dữ liệu thu thập được với sự chọn không tham gia sẽ cung cấp dữ liệu không thiên vị mà các kỹ sư có thể làm được.
Câu hỏi mà dữ liệu có thể giúp câu trả lời bao gồm "những trang web hàng đầu là những người dùng truy cập", "những trang web sử dụng Flash người dùng không cho phép" và "những trang web nào người dùng xem heavy Jank" theo Fritzsche.
Giải pháp Fritzsche đề xuất sử dụng sự riêng tư khác biệt và dự án RAPPOR nguồn mở của Google. Ý tưởng chủ chốt đằng sau sự riêng tư khác biệt là bất kỳ truy vấn nào chống lại một bộ dữ liệu không được tiết lộ, liệu một người cụ thể hoặc dữ liệu của người đó bị phơi bày. Điều này được thực hiện bằng cách đưa ra sự ngẫu nhiên đối với dữ liệu.
Mozilla lên kế hoạch chạy một nghiên cứu về một tập con của số bản phát hành Firefox để thử nghiệm việc triển khai. Tổ chức có kế hoạch thực hiện việc lựa chọn không tham gia, điều này có nghĩa là người dùng Firefox cần vô hiệu hóa điều này một cách tích cực nếu họ không muốn dữ liệu duyệt web của họ - dưới dạng ẩn danh - được gửi tới Mozilla.
Những gì họ dự định làm bây giờ là chạy một nghiên cứu SHIELD không tham gia để xác nhận tính thực hiện RAPPOR. Nghiên cứu này sẽ thu thập giá trị cho trang chủ của người dùng (eTLD + 1) cho một nhóm dân số được phát hành ngẫu nhiên của họ và hy vọng sẽ khởi động vào giữa tháng 9.
Nhìn xa Mozilla dự định sẽ chỉ thu thập tên miền cấp cao nhất, ví dụ: Ghacks.net mà không có tên miền phụ hoặc thư mục.
Một phản đối rằng người dùng Firefox đã trả lời bài đăng trên Google Groups hoặc ở nơi khác là việc bỏ chọn tính năng là chống lại sự riêng tư cho dù dữ liệu được thu thập không thể truy xuất trở lại cho người dùng.
Những người khác cho rằng Mozilla có thể lấy một số dữ liệu khác, ví dụ như thu thập dữ liệu các trang web để kiểm tra xem họ vẫn sử dụng Flash hay bằng cách sử dụng các dịch vụ để lấy thông tin trên các trang web hàng đầu trên mạng.
Tiếp bước Google Chrome là Mozilla Firefox kế tiếp là ... Liệu còn chút gì riêng tư nữa không ?!
Tham khảo Net