چگونه کار می کند

Aggregation Service به فن آوری های تبلیغاتی امکان می دهد تا داده های عملکرد تبلیغات رمزگذاری شده را برای تجزیه و تحلیل و بهینه سازی کمپین های تبلیغاتی بازیابی کنند. این اطلاعات بینشی در مورد نحوه عملکرد تبلیغات شما ارائه می دهد تا بتوانید ببینید چه چیزی برای کسب و کار شما مفید است و چه چیزی نیست.

این سند موارد زیر را توضیح می دهد :

این سند شامل موارد زیر نمی شود:

این سند برای چه کسی است؟

این صفحه برای فناوری‌های تبلیغاتی و توسعه‌دهندگانی است که می‌خواهند بدانند چگونه APIهای اندازه‌گیری مشتری اصلی که برای فعال کردن موارد استفاده تبلیغاتی و در عین حال محافظت از حریم خصوصی کاربر طراحی شده‌اند، با هم کار می‌کنند.

این سند فرض می‌کند که از قبل با Private Aggregation API , Attribution Reporting API , Protected Audience API , Shared Storage و Trusted Execution Environments آشنا هستید.

اصطلاحات و مفاهیم کلیدی

قبل از ادامه با اصطلاحات کلیدی آشنا شوید:

واژه نامه

فناوری تبلیغات

پلتفرم تبلیغاتی شرکتی است که خدماتی را برای ارائه تبلیغات ارائه می دهد.

گزارش های جمع آوری

گزارش‌های انبوه، گزارش‌های رمزگذاری‌شده‌ای هستند که از دستگاه‌های کاربر جداگانه ارسال می‌شوند. این گزارش‌ها حاوی داده‌هایی درباره رفتار کاربران بین سایتی و تبدیل‌ها هستند. تبدیل‌ها (گاهی اوقات رویدادهای راه‌اندازی اسناد نامیده می‌شوند) و معیارهای مرتبط توسط تبلیغ‌کننده یا فناوری تبلیغات تعریف می‌شوند. هر گزارش برای جلوگیری از دسترسی طرف های مختلف به داده های اساسی رمزگذاری شده است.

درباره گزارش‌های جمع‌آوری‌شده بیشتر بیاموزید .

حسابداری گزارش انباشته

یک دفتر کل توزیع شده، واقع در هر دو هماهنگ کننده، که بودجه حفظ حریم خصوصی اختصاص داده شده را ردیابی می کند و قانون "بدون تکرار" را اجرا می کند. این مکانیزم حفظ حریم خصوصی است که در هماهنگ‌کننده‌ها قرار گرفته و اجرا می‌شود، که تضمین می‌کند هیچ گزارشی فراتر از بودجه اختصاص داده شده از طریق سرویس تجمیع ارسال نمی‌شود.

در مورد نحوه ارتباط استراتژی های دسته بندی با گزارش های جمع آوری بیشتر بخوانید .

گزارش تجمیع بودجه حسابداری

ارجاع به بودجه ای که تضمین می کند گزارش های فردی بیش از یک بار پردازش نمی شوند.

سرویس تجمع

یک سرویس مبتنی بر فناوری تبلیغات که گزارش‌های جمع‌آوری‌شده را برای ایجاد یک گزارش خلاصه پردازش می‌کند.

در توضیح ما و فهرست کامل اصطلاحات، درباره پیشینه خدمات تجمع بیشتر بخوانید.

تصدیق

مکانیزمی برای احراز هویت نرم افزار، معمولاً با هش ها یا امضاهای رمزنگاری . برای پیشنهاد سرویس تجمیع، گواهی کد اجرا شده در سرویس تجمیع فناوری تبلیغاتی شما را با کد منبع باز مطابقت می دهد.

در مورد گواهینامه بیشتر بخوانید .

پیوند مشارکتی
هماهنگ کننده

نهادهای مسئول مدیریت کلیدی و حسابداری گزارش انبوه. یک Coordinator فهرستی از هش‌های پیکربندی‌های سرویس تجمیع تایید شده را نگهداری می‌کند و دسترسی به کلیدهای رمزگشایی را پیکربندی می‌کند.

سر و صدا و پوسته پوسته شدن

نویز آماری که در طول فرآیند تجمیع به گزارش‌های خلاصه اضافه می‌شود تا حریم خصوصی حفظ شود و اطمینان حاصل شود که گزارش‌های نهایی اطلاعات اندازه‌گیری ناشناس را ارائه می‌کنند.

در مورد مکانیسم نویز افزایشی که از توزیع لاپلاس گرفته شده است بیشتر بخوانید.

منبع گزارش

نهادی که گزارش‌های جمع‌آوری‌شده را دریافت می‌کند - به عبارت دیگر، شما یا یک فناوری تبلیغاتی که API گزارش Attribution نامیده می‌شود. گزارش‌های جمع‌آوری‌شده از دستگاه‌های کاربر به یک URL معروف مرتبط با منبع گزارش ارسال می‌شوند. مبدا گزارش در هنگام ثبت نام تعیین می شود.

شناسه مشترک

یک مقدار محاسبه‌شده که شامل shared_info ، reporting_origin ، destination_site (فقط برای Attribution Reporting API)، source_registration-time (فقط برای Attribution Reporting API)، scheduled_report_time و نسخه است.

گزارش‌های متعددی که ویژگی‌های یکسانی را در قسمت shared_info به اشتراک می‌گذارند باید دارای شناسه مشترک یکسان باشند. شناسه های مشترک نقش مهمی در حسابداری گزارش جمعی ایفا می کنند.

درباره سرورهای مورد اعتماد بیشتر بخوانید .

گزارش خلاصه

یک API گزارش انتساب و نوع گزارش API جمع‌آوری خصوصی. گزارش خلاصه شامل داده‌های کاربر جمع‌آوری شده است و می‌تواند حاوی داده‌های تبدیل دقیق با نویز اضافه شده باشد. گزارش های خلاصه از گزارش های انبوه تشکیل شده است. آنها به انعطاف پذیری بیشتری اجازه می دهند و مدل داده غنی تری را نسبت به گزارش در سطح رویداد ارائه می دهند، به ویژه برای برخی موارد استفاده مانند مقادیر تبدیل.

محیط اجرای مورد اعتماد ( TEE )

پیکربندی ایمن از سخت‌افزار و نرم‌افزار رایانه که به طرف‌های خارجی اجازه می‌دهد تا نسخه‌های دقیق نرم‌افزار در حال اجرا بر روی دستگاه را بدون ترس از قرار گرفتن در معرض آن تأیید کنند. TEE ها به طرف های خارجی اجازه می دهند تا تأیید کنند که نرم افزار دقیقاً همان کاری را که سازنده نرم افزار ادعا می کند انجام می دهد - نه بیشتر یا کمتر.

برای کسب اطلاعات بیشتر در مورد TEE های مورد استفاده برای پیشنهادات جعبه ایمنی حریم خصوصی، توضیح خدمات API مخاطبین محافظت شده و توضیح سرویس تجمع را بخوانید.

گردش کار خدمات جمع آوری

جریان تولید گزارش از مراحل زیر تشکیل شده است:

  1. یک مرورگر کلید عمومی را برای تولید گزارش های رمزگذاری شده واکشی می کند.
  2. گزارش‌های انبوه رمزگذاری‌شده به سرورهای فناوری تبلیغات ارسال می‌شوند تا جمع‌آوری، تبدیل و دسته‌بندی شوند.
  3. سرور فناوری تبلیغات گزارش‌ها را دسته‌بندی می‌کند (در قالب avro) و آنها را به سرویس تجمع ارسال می‌کند.
  4. یک کارگر جمع‌آوری گزارش‌های جمع‌آوری شده را برای رمزگشایی بازیابی می‌کند.
  5. Aggregation Worker کلیدهای رمزگشایی را از یک Coordinator بازیابی می کند.
  6. Aggregation Worker گزارش ها را برای تجمع و نویز رمزگشایی می کند.
  7. خدمات حسابداری گزارش جمع آوری بررسی می کند که آیا بودجه حفظ حریم خصوصی کافی برای ایجاد یک گزارش خلاصه برای گزارش های جمع آوری داده شده وجود دارد یا خیر.
  8. خدمات جمع آوری گزارش خلاصه نهایی را ارائه می دهد.

نمودار زیر سرویس تجمع را در عمل نشان می دهد، از زمانی که گزارش ها از وب و دستگاه های تلفن همراه دریافت می شوند، تا زمانی که گزارش خلاصه در سرویس جمع آوری ایجاد می شود.

جریان خدمات جمع آوری انتها به انتها.
جریان خدمات جمع آوری انتها به انتها

به طور خلاصه، Attribution Reporting API یا Private Aggregation API گزارش هایی از چندین نمونه مرورگر تولید می کند. Chrome کلید عمومی را که هر هفت روز یکبار چرخش می‌کند، از سرویس میزبانی کلید در Coordinator دریافت می‌کند تا گزارش‌ها را قبل از ارسال به مبدا گزارش‌دهی فناوری تبلیغات شما رمزگذاری کند. مبدا گزارش‌دهی فناوری تبلیغات شما گزارش‌های دریافتی را به فرمت avro جمع‌آوری و تبدیل می‌کند و آن‌ها را به سرویس تجمیع شما ارسال می‌کند. هنگامی که یک درخواست دسته‌ای را به سرویس تجمیع ارسال می‌کنید، کلیدهای رمزگشایی را از سرویس میزبانی کلید واکشی می‌کند، گزارش‌ها را رمزگشایی می‌کند و آنها را جمع‌آوری می‌کند و نویز می‌کند تا یک گزارش خلاصه ایجاد کند، تا زمانی که بودجه حفظ حریم خصوصی کافی برای ایجاد آنها وجود داشته باشد.

در قسمت پیاده سازی می توانید اطلاعات بیشتری در مورد نحوه تهیه گزارش های تجمیعی خود بخوانید.

دسته بندی گزارش های انبوه

جریان گزارش بدون کمک سرور منبع گزارش تعیین شده کامل نمی شود. این منبعی است که در فرآیند ثبت نام ارسال می کردید. منبع گزارش مسئول جمع‌آوری، تبدیل و دسته‌بندی گزارش‌های انباشته‌ای است که دریافت می‌کند و آماده‌سازی آنها برای ارسال به سرویس تجمع شما در Google Cloud یا Amazon Web Services. در مورد نحوه تهیه گزارش های انبوه خود بیشتر بخوانید.

اکنون که مفهوم کلی را در اختیار دارید، می‌توانیم به مؤلفه‌هایی که در سرویس تجمیع شما مستقر شده‌اند نگاهی دقیق‌تر بیندازیم.

اجزای ابر

سرویس تجمیع شامل چندین مؤلفه سرویس ابری است. شما از اسکریپت های Terraform ارائه شده برای تهیه و پیکربندی تمام اجزای خدمات ابری ضروری استفاده می کنید.

اجزای ابری سرویس تجمع.
اجزای ابری سرویس تجمع.

سرویس Frontend

سرویس ابری مدیریت شده: عملکرد ابر (Google Cloud) / دروازه API (سرویس وب آمازون)

سرویس Frontend یک دروازه بدون سرور است که نقطه ورود اولیه برای فراخوان های Aggregation API برای ایجاد شغل و بازیابی وضعیت شغلی است. مسئولیت دریافت درخواست‌های کاربران سرویس تجمع، اعتبارسنجی پارامترهای ورودی و آغاز فرآیند زمان‌بندی کار تجمیع را بر عهده دارد.

سرویس Frontend دو API در دسترس دارد:

نقطه پایانی توضیحات
createJob این API یک کار Aggregation Service را راه اندازی می کند. برای فعال کردن کار به اطلاعاتی مانند شناسه شغل، جزئیات ذخیره سازی ورودی، جزئیات ذخیره سازی خروجی، مبدا گزارش و موارد دیگر نیاز دارد.
getJob این API وضعیت کار را با شناسه شغلی مشخص برمی گرداند. اطلاعاتی درباره وضعیت کار، مانند "دریافت"، "در حال انجام" یا "تمام" ارائه می دهد. اگر کار تمام شد، نتیجه کار را نیز برمی‌گرداند، از جمله هر پیام خطایی که در طول اجرای کار با آن مواجه می‌شوید.

اسناد API Service Aggregation را بررسی کنید.

صف کار

سرویس ابری مدیریت شده: Pub/Sub (Google Cloud) / Amazon SQS (سرویس وب آمازون)

Job Queue یک صف پیام حاوی درخواست های شغلی برای سرویس Aggregation است. سرویس Frontend درخواست‌های شغلی را در صف قرار می‌دهد، که سپس توسط کارگران جمع‌آوری که آنها را پردازش می‌کنند مصرف می‌شود.

ذخیره سازی ابری

سرویس ابری مدیریت شده: Google Cloud Storage (Google Cloud) / آمازون S3 (سرویس وب آمازون)

فایل های ورودی و خروجی مورد استفاده توسط سرویس تجمع، مانند فایل های گزارش رمزگذاری شده و گزارش های خلاصه خروجی، در فضای ذخیره سازی ابری نگهداری می شوند.

پایگاه داده فراداده مشاغل

سرویس ابری مدیریت شده: Spanner (Google Cloud) / DynamoDB (سرویس وب آمازون)

پایگاه داده فراداده شغلی برای ذخیره و ردیابی وضعیت مشاغل تجمیع استفاده می شود. این ابرداده مانند زمان ایجاد، زمان درخواستی، زمان به‌روزرسانی و وضعیتی مانند دریافت، در حال انجام، یا پایان را ثبت می‌کند. Aggregation Workers پایگاه داده فراداده شغلی را با پیشرفت مشاغل به روز می کنند.

کارگر تجمع

سرویس ابری مدیریت شده: موتور محاسباتی با فضای محرمانه (Google Cloud) / خدمات وب آمازون EC2 با Nitro Enclave (سرویس وب آمازون)

یک کارگر جمع‌آوری درخواست‌های شغلی را در Job Queue پردازش می‌کند و ورودی‌های رمزگذاری‌شده را با استفاده از کلیدهایی که از سرویس تولید و توزیع کلید (KGDS) در Coordinators واکشی می‌کند، رمزگشایی می‌کند. برای به حداقل رساندن تأخیر پردازش کار، Aggregation Workers کلیدهای رمزگشایی را برای مدت 8 ساعت در حافظه پنهان نگه می دارد و از آنها در کارهایی که پردازش می کنند استفاده می کند.

کارگران تجمیع در یک نمونه محیط اجرای معتمد (TEE) عمل می کنند. یک کارگر در یک زمان تنها یک کار را انجام می دهد. می‌توانید چندین کارگر را برای پردازش موازی کارها با تنظیم پیکربندی مقیاس‌بندی خودکار پیکربندی کنید. در صورت استفاده، مقیاس خودکار به صورت پویا تعداد کارگران را با توجه به تعداد پیام‌های موجود در صف کار تنظیم می‌کند. شما می توانید حداقل و حداکثر تعداد کارگران را برای مقیاس خودکار از طریق فایل محیط Terraform پیکربندی کنید. اطلاعات بیشتر درباره مقیاس خودکار را می‌توانید در این اسکریپت‌های Terraform پیدا کنید: خدمات وب آمازون یا Google Cloud .

کارگران تجمیع برای حسابداری گزارش تجمیع با خدمات حسابداری گزارش انبوه تماس می گیرند. این سرویس تضمین می‌کند که مشاغل تنها در صورتی اجرا می‌شوند که از محدودیت بودجه حفظ حریم خصوصی تجاوز نکرده باشند. (به قانون "بدون تکرار" مراجعه کنید.) اگر بودجه در دسترس باشد، یک گزارش خلاصه با استفاده از مجموعات پر سر و صدا ایجاد می شود. جزئیات بیشتر در مورد حسابداری گزارش انبوه را بخوانید.

Aggregation Workers فراداده های شغلی را در پایگاه داده فراداده شغلی به روز می کند. این اطلاعات شامل کدهای بازگشت کار و شمارشگر خطای گزارش در صورت عدم موفقیت جزئی گزارش می باشد. کاربران می توانند با استفاده از getJob job retrieval API وضعیت را واکشی کنند.

برای توضیحات دقیق تر از سرویس تجمیع به این توضیح مراجعه کنید.

مراحل بعدی

اکنون که می‌دانید سرویس جمع‌آوری چگونه کار می‌کند، نمونه‌ای از سرویس جمع‌آوری را از طریق Google Cloud یا وب سرویس‌های آمازون مستقر کنید. راهنمای شروع کار را ببینید.