ব্লগে ফিরে যান

আপনার অ্যানালিটিক্স স্ট্যাকে 'Privacy-First' আসলে কী মানে

এই বাক্যাংশটি সর্বত্র, কিন্তু এটি ব্যবহার করা বেশিরভাগ টুল এখনও শনাক্তকারী, ফিঙ্গারপ্রিন্ট বা হ্যাশড ইমেইল সংরক্ষণ করে। একটি প্রযুক্তিগতভাবে সঠিক গোপনীয়তা-প্রথম ডেটা মডেল কেমন দেখায়, তা এখানে দেওয়া হলো।

"Privacy-first" একটি বিপণন বাক্যাংশ হয়ে উঠেছে। যে টুলগুলো এটি ব্যবহার করে সেগুলো প্রকৃতপক্ষে কোনো ব্যক্তিগত ডেটা সংরক্ষণ না করা থেকে শুরু করে শুধু তাদের কুকি সার্ভার-সাইড স্টোরেজে সরিয়ে নিজেদের সম্মত বলে ডাকা পর্যন্ত পরিসর। দাবিটি মূল্যায়ন করতে, আপনাকে তিনটি নির্দিষ্ট জিনিস দেখতে হবে: কী সংগ্রহ করা হয়, কীভাবে এটি সংরক্ষণ করা হয় এবং এটি বিপরীত করা যায় কিনা।

লেভেল 1: কী সংগ্রহ করা হয়

প্রতিটি অ্যানালিটিক্স টুল কিছু না কিছু সংগ্রহ করে। প্রশ্ন হলো GDPR, LGPD বা CCPA-এর অধীনে এর কোনোটি ব্যক্তিগত ডেটা হিসেবে যোগ্য কিনা। নিম্নলিখিত সাধারণত নিরাপদ — সেগুলো নিজেদের উপর সমষ্টিগত বা অশনাক্তযোগ্য:

  • পেজ URL এবং পাথ
  • রেফারার ডোমেইন (সম্পূর্ণ URL নয়)
  • দেশ (edge-এ IP থেকে অনুমান করা, কখনো সংরক্ষণ করা হয় না)
  • ডিভাইস টাইপ (মোবাইল বা ডেস্কটপ, স্ক্রিন প্রস্থ এবং বিস্তৃত User-Agent প্যাটার্ন থেকে অনুমান করা)
  • ব্রাউজার পরিবার (Chrome, Safari, Firefox এবং অন্যান্য মোটামুটি পরিবার অনুরোধের User-Agent থেকে সার্ভার-সাইডে উদ্ভূত)

এগুলোকে নিরাপদ করে তোলে যে এগুলোর কোনোটিই, স্বতন্ত্রভাবে বা একত্রিত, একজন নির্দিষ্ট ব্যক্তিকে নির্ভরযোগ্যভাবে শনাক্ত করে না। একটি রেফারার ডোমেইন আপনাকে বলে যে কেউ Hacker News থেকে এসেছেন — Hacker News-এর কোন ব্যবহারকারী তারা তা নয়।

লাইনটি অতিক্রম করা হয় যখন আপনি IP অ্যাড্রেস, সম্পূর্ণ ইউজার এজেন্ট, ডিভাইস ফিঙ্গারপ্রিন্ট বা যেকোনো ধরনের স্থায়ী শনাক্তকারী — এমনকি একটি হ্যাশড যা আপনি সেশন জুড়ে ধরে রাখেন — সংরক্ষণ করা শুরু করেন।

লেভেল 2: ডেটা কীভাবে সংরক্ষণ করা হয়

নিরাপদে ডেটা সংগ্রহ করা এটি নিরাপদে সংরক্ষণ করার চেয়ে ভিন্ন। অনেক টুল দাবি করে যে তারা কুকি ব্যবহার করে না, তারপর একটি IP অ্যাড্রেসের সাথে আবদ্ধ একটি সার্ভার-সাইড সেশনে একটি ভিজিটর ID সংরক্ষণ করে। GDPR-এর অধীনে IP অ্যাড্রেস ব্যক্তিগত ডেটা। কুকি সার্ভার-সাইডে সরে গেছে এই সত্য ট্র্যাক করা হচ্ছে তা পরিবর্তন করে না।

একটি প্রকৃত গোপনীয়তা-প্রথম স্টোর শুধুমাত্র উপরে তালিকাভুক্ত যা আছে তা ধারণ করে — এবং একটি ভিজিটর শনাক্তকারী যা কোনো ব্যক্তির সাথে ফিরে লিঙ্ক করা যায় না। Monoid-এর পদ্ধতি একটি দৈনিক একমুখী হ্যাশ:

visitor_hash = SHA-256(IP + UA + SALT_SECRET + YYYY-MM-DD)

তিনটি বৈশিষ্ট্য এটিকে নিরাপদ করে তোলে:

One-way: SHA-256 বিপরীতযোগ্য নয়। আপনি হ্যাশ থেকে IP অ্যাড্রেস পুনরুদ্ধার করতে পারবেন না। Salted: সার্ভার-সাইড SALT_SECRET-এর অর্থ হলো অ্যালগরিদম জানা থাকলেও হ্যাশ রেইনবো-টেবিল আক্রমণ করা যাবে না। Daily: ইনপুটে তারিখের অর্থ হলো একই দর্শনার্থী আগামীকাল একটি ভিন্ন হ্যাশ উৎপাদন করেন। কোনো স্থায়ী ক্রস-সেশন শনাক্তকারী নেই।

হ্যাশটি সময়ের সাথে একজন ব্যক্তিকে ট্র্যাক করার জন্য উপযোগী নয়। এটি শুধুমাত্র একটি একক দিনের মধ্যে দর্শনার্থীদের ডিডুপ্লিকেট করার জন্য উপযোগী, যা একমাত্র কাজ যা এটি করার প্রয়োজন।

লেভেল 3: এটি কি বিপরীত করা যায়?

এই পরীক্ষাটি প্রকৃত গোপনীয়তা-প্রথম টুলগুলোকে বিপণন দাবি থেকে আলাদা করে। যদি যথেষ্ট অনুপ্রাণিত একটি প্রতিপক্ষ — একটি আইনি আদেশ সহ একটি সরকার সহ — আপনার অ্যানালিটিক্স ডেটাবেস পায়, তারা কী শিখতে পারে?

Monoid-এর ডেটা মডেলের সাথে: তারা শিখতে পারে কোন পেজগুলো ভিজিট করা হয়েছে, কোন দেশ থেকে, কোন ডিভাইসে এবং কোন দিনে। তারা শিখতে পারবে না কোন নির্দিষ্ট ব্যক্তি কোন নির্দিষ্ট পেজ ভিজিট করেছেন। হ্যাশ তাদের আসল IP, আসল ইউজার এজেন্ট, সিক্রেট সল্ট এবং সঠিক তারিখ ছাড়া কিছুই বলে না — এর সবগুলোই কখনো একসাথে সংরক্ষণ করা হয় না।

এটিকে "anonymized" GA4 ডেটার সাথে তুলনা করুন, যা ক্লায়েন্ট ID (স্থায়ী কুকি-ভিত্তিক শনাক্তকারী), মিলিসেকেন্ড নির্ভুলতা সহ ইভেন্ট টাইমস্ট্যাম্প এবং ডিভাইস ফিঙ্গারপ্রিন্ট উপাদান ধরে রাখে। সেই ডেটা বেনামী নয় — এটি সর্বোত্তমভাবে ছদ্মনাম এবং মাঝারি প্রচেষ্টায় বাস্তব ব্যবহারকারীদের সাথে লিঙ্কযোগ্য।

ডেটাবেস আসলে কেমন দেখায়

একটি Monoid পেজভিউ রেকর্ডে রয়েছে: site_id, path, referrer, country, device, browser_family, visitor_hash (একমুখী দৈনিক হ্যাশ) এবং একটি timestamp। এটিই সম্পূর্ণ রেকর্ড। কোনো IP অ্যাড্রেস কলাম, সম্পূর্ণ User-Agent স্ট্রিং, ব্রাউজার সংস্করণ, স্থায়ী ব্যবহারকারী ID বা সেশন টোকেন নেই। স্কিমাতে এমন কিছুই নেই যা একজন প্রকৃত ব্যক্তির সাথে ম্যাপ করে।

ডেটা মডেল স্তরে গোপনীয়তা-প্রথম এমনই দেখায়। বাকি সবকিছু — ড্যাশবোর্ড, রিয়েল-টাইম গণনা, দেশ ব্রেকডাউন — সেই ফিল্ডগুলো থেকে গণনা করা হয়।

কেন পার্থক্য বাস্তবে গুরুত্বপূর্ণ

আপনার অ্যানালিটিক্স টুল যদি ব্যক্তিগত ডেটা সংরক্ষণ করে, আপনি বাধ্যবাধকতা সহ একজন GDPR ডেটা কন্ট্রোলার: আপনাকে প্রক্রিয়াকরণের জন্য একটি বৈধ ভিত্তি প্রকাশ করতে হবে, প্রক্রিয়াকরণ কার্যক্রমের রেকর্ড বজায় রাখতে হবে এবং ডেটা সাবজেক্ট অ্যাক্সেস অনুরোধে সাড়া দিতে হবে। আপনার বৈধ ভিত্তি কনসেন্ট হলে আপনার একটি কনসেন্ট মেকানিজমও প্রয়োজন।

যদি আপনার অ্যানালিটিক্স টুল শুধুমাত্র অ-ব্যক্তিগত সমষ্টিগত ডেটা সংরক্ষণ করে, তাহলে সেই বাধ্যবাধকতাগুলো প্রযোজ্য নয় — কারণ নিয়ন্ত্রণ করার মতো কোনো ব্যক্তিগত ডেটা নেই। আইনি ওভারহেড কনসেন্ট ব্যানারের সাথে অদৃশ্য হয়ে যায়।