Aggregation Service به فن آوری های تبلیغاتی امکان می دهد تا داده های عملکرد تبلیغات رمزگذاری شده را برای تجزیه و تحلیل و بهینه سازی کمپین های تبلیغاتی بازیابی کنند. این اطلاعات بینشی در مورد نحوه عملکرد تبلیغات شما ارائه می دهد تا بتوانید ببینید چه چیزی برای کسب و کار شما مفید است و چه چیزی نیست.
این سند موارد زیر را توضیح می دهد :
- اصطلاحات و مفاهیم کلیدی
- چگونه سرویس تجمیع کار می کند تا داده های تبدیل دقیق و اندازه گیری های دستیابی را از گزارش های انبوهی خام به شما ارائه دهد
- گزارشهای جمعآوری دستهای مرور مفهومی
- بررسی اجمالی مفهومی اجزای ابر
این سند شامل موارد زیر نمی شود:
- جزئیات طراحی معماری: برای اطلاعات بیشتر می توانید اسناد GitHub را بخوانید .
- راهنمای پیاده سازی: برای دستورالعمل های استقرار می توانید راهنمای شروع کار را بخوانید .
این سند برای چه کسی است؟
این صفحه برای فناوریهای تبلیغاتی و توسعهدهندگانی است که میخواهند بدانند چگونه APIهای اندازهگیری مشتری اصلی که برای فعال کردن موارد استفاده تبلیغاتی و در عین حال محافظت از حریم خصوصی کاربر طراحی شدهاند، با هم کار میکنند.
این سند فرض میکند که از قبل با Private Aggregation API , Attribution Reporting API , Protected Audience API , Shared Storage و Trusted Execution Environments آشنا هستید.
اصطلاحات و مفاهیم کلیدی
قبل از ادامه با اصطلاحات کلیدی آشنا شوید:
واژه نامه
- فناوری تبلیغات
-
پلتفرم تبلیغاتی شرکتی است که خدماتی را برای ارائه تبلیغات ارائه می دهد.
- گزارش های جمع آوری
-
گزارشهای انبوه، گزارشهای رمزگذاریشدهای هستند که از دستگاههای کاربر جداگانه ارسال میشوند. این گزارشها حاوی دادههایی درباره رفتار کاربران بین سایتی و تبدیلها هستند. تبدیلها (گاهی اوقات رویدادهای راهاندازی اسناد نامیده میشوند) و معیارهای مرتبط توسط تبلیغکننده یا فناوری تبلیغات تعریف میشوند. هر گزارش برای جلوگیری از دسترسی طرف های مختلف به داده های اساسی رمزگذاری شده است.
- حسابداری گزارش انباشته
-
یک دفتر کل توزیع شده، واقع در هر دو هماهنگ کننده، که بودجه حفظ حریم خصوصی اختصاص داده شده را ردیابی می کند و قانون "بدون تکرار" را اجرا می کند. این مکانیزم حفظ حریم خصوصی است که در هماهنگکنندهها قرار گرفته و اجرا میشود، که تضمین میکند هیچ گزارشی فراتر از بودجه اختصاص داده شده از طریق سرویس تجمیع ارسال نمیشود.
در مورد نحوه ارتباط استراتژی های دسته بندی با گزارش های جمع آوری بیشتر بخوانید .
- گزارش تجمیع بودجه حسابداری
-
ارجاع به بودجه ای که تضمین می کند گزارش های فردی بیش از یک بار پردازش نمی شوند.
- سرویس تجمع
-
یک سرویس مبتنی بر فناوری تبلیغات که گزارشهای جمعآوریشده را برای ایجاد یک گزارش خلاصه پردازش میکند.
در توضیح ما و فهرست کامل اصطلاحات، درباره پیشینه خدمات تجمع بیشتر بخوانید.
- تصدیق
-
مکانیزمی برای احراز هویت نرم افزار، معمولاً با هش ها یا امضاهای رمزنگاری . برای پیشنهاد سرویس تجمیع، گواهی کد اجرا شده در سرویس تجمیع فناوری تبلیغاتی شما را با کد منبع باز مطابقت می دهد.
- پیوند مشارکتی
- هماهنگ کننده
-
نهادهای مسئول مدیریت کلیدی و حسابداری گزارش انبوه. یک Coordinator فهرستی از هشهای پیکربندیهای سرویس تجمیع تایید شده را نگهداری میکند و دسترسی به کلیدهای رمزگشایی را پیکربندی میکند.
- سر و صدا و پوسته پوسته شدن
-
نویز آماری که در طول فرآیند تجمیع به گزارشهای خلاصه اضافه میشود تا حریم خصوصی حفظ شود و اطمینان حاصل شود که گزارشهای نهایی اطلاعات اندازهگیری ناشناس را ارائه میکنند.
در مورد مکانیسم نویز افزایشی که از توزیع لاپلاس گرفته شده است بیشتر بخوانید.
- منبع گزارش
-
نهادی که گزارشهای جمعآوریشده را دریافت میکند - به عبارت دیگر، شما یا یک فناوری تبلیغاتی که API گزارش Attribution نامیده میشود. گزارشهای جمعآوریشده از دستگاههای کاربر به یک URL معروف مرتبط با منبع گزارش ارسال میشوند. مبدا گزارش در هنگام ثبت نام تعیین می شود.
- شناسه مشترک
-
یک مقدار محاسبهشده که شامل
shared_info
،reporting_origin
،destination_site
(فقط برای Attribution Reporting API)،source_registration-time
(فقط برای Attribution Reporting API)،scheduled_report_time
و نسخه است.گزارشهای متعددی که ویژگیهای یکسانی را در قسمت
shared_info
به اشتراک میگذارند باید دارای شناسه مشترک یکسان باشند. شناسه های مشترک نقش مهمی در حسابداری گزارش جمعی ایفا می کنند. - گزارش خلاصه
-
یک API گزارش انتساب و نوع گزارش API جمعآوری خصوصی. گزارش خلاصه شامل دادههای کاربر جمعآوری شده است و میتواند حاوی دادههای تبدیل دقیق با نویز اضافه شده باشد. گزارش های خلاصه از گزارش های انبوه تشکیل شده است. آنها به انعطاف پذیری بیشتری اجازه می دهند و مدل داده غنی تری را نسبت به گزارش در سطح رویداد ارائه می دهند، به ویژه برای برخی موارد استفاده مانند مقادیر تبدیل.
- محیط اجرای مورد اعتماد ( TEE )
-
پیکربندی ایمن از سختافزار و نرمافزار رایانه که به طرفهای خارجی اجازه میدهد تا نسخههای دقیق نرمافزار در حال اجرا بر روی دستگاه را بدون ترس از قرار گرفتن در معرض آن تأیید کنند. TEE ها به طرف های خارجی اجازه می دهند تا تأیید کنند که نرم افزار دقیقاً همان کاری را که سازنده نرم افزار ادعا می کند انجام می دهد - نه بیشتر یا کمتر.
برای کسب اطلاعات بیشتر در مورد TEE های مورد استفاده برای پیشنهادات جعبه ایمنی حریم خصوصی، توضیح خدمات API مخاطبین محافظت شده و توضیح سرویس تجمع را بخوانید.
گردش کار خدمات جمع آوری
جریان تولید گزارش از مراحل زیر تشکیل شده است:
- یک مرورگر کلید عمومی را برای تولید گزارش های رمزگذاری شده واکشی می کند.
- گزارشهای انبوه رمزگذاریشده به سرورهای فناوری تبلیغات ارسال میشوند تا جمعآوری، تبدیل و دستهبندی شوند.
- سرور فناوری تبلیغات گزارشها را دستهبندی میکند (در قالب avro) و آنها را به سرویس تجمع ارسال میکند.
- یک کارگر جمعآوری گزارشهای جمعآوری شده را برای رمزگشایی بازیابی میکند.
- Aggregation Worker کلیدهای رمزگشایی را از یک Coordinator بازیابی می کند.
- Aggregation Worker گزارش ها را برای تجمع و نویز رمزگشایی می کند.
- خدمات حسابداری گزارش جمع آوری بررسی می کند که آیا بودجه حفظ حریم خصوصی کافی برای ایجاد یک گزارش خلاصه برای گزارش های جمع آوری داده شده وجود دارد یا خیر.
- خدمات جمع آوری گزارش خلاصه نهایی را ارائه می دهد.
نمودار زیر سرویس تجمع را در عمل نشان می دهد، از زمانی که گزارش ها از وب و دستگاه های تلفن همراه دریافت می شوند، تا زمانی که گزارش خلاصه در سرویس جمع آوری ایجاد می شود.

به طور خلاصه، Attribution Reporting API یا Private Aggregation API گزارش هایی از چندین نمونه مرورگر تولید می کند. Chrome کلید عمومی را که هر هفت روز یکبار چرخش میکند، از سرویس میزبانی کلید در Coordinator دریافت میکند تا گزارشها را قبل از ارسال به مبدا گزارشدهی فناوری تبلیغات شما رمزگذاری کند. مبدا گزارشدهی فناوری تبلیغات شما گزارشهای دریافتی را به فرمت avro جمعآوری و تبدیل میکند و آنها را به سرویس تجمیع شما ارسال میکند. هنگامی که یک درخواست دستهای را به سرویس تجمیع ارسال میکنید، کلیدهای رمزگشایی را از سرویس میزبانی کلید واکشی میکند، گزارشها را رمزگشایی میکند و آنها را جمعآوری میکند و نویز میکند تا یک گزارش خلاصه ایجاد کند، تا زمانی که بودجه حفظ حریم خصوصی کافی برای ایجاد آنها وجود داشته باشد.
در قسمت پیاده سازی می توانید اطلاعات بیشتری در مورد نحوه تهیه گزارش های تجمیعی خود بخوانید.
دسته بندی گزارش های انبوه
جریان گزارش بدون کمک سرور منبع گزارش تعیین شده کامل نمی شود. این منبعی است که در فرآیند ثبت نام ارسال می کردید. منبع گزارش مسئول جمعآوری، تبدیل و دستهبندی گزارشهای انباشتهای است که دریافت میکند و آمادهسازی آنها برای ارسال به سرویس تجمع شما در Google Cloud یا Amazon Web Services. در مورد نحوه تهیه گزارش های انبوه خود بیشتر بخوانید.
اکنون که مفهوم کلی را در اختیار دارید، میتوانیم به مؤلفههایی که در سرویس تجمیع شما مستقر شدهاند نگاهی دقیقتر بیندازیم.
اجزای ابر
سرویس تجمیع شامل چندین مؤلفه سرویس ابری است. شما از اسکریپت های Terraform ارائه شده برای تهیه و پیکربندی تمام اجزای خدمات ابری ضروری استفاده می کنید.

سرویس Frontend
سرویس ابری مدیریت شده: عملکرد ابر (Google Cloud) / دروازه API (سرویس وب آمازون)
سرویس Frontend یک دروازه بدون سرور است که نقطه ورود اولیه برای فراخوان های Aggregation API برای ایجاد شغل و بازیابی وضعیت شغلی است. مسئولیت دریافت درخواستهای کاربران سرویس تجمع، اعتبارسنجی پارامترهای ورودی و آغاز فرآیند زمانبندی کار تجمیع را بر عهده دارد.
سرویس Frontend دو API در دسترس دارد:
نقطه پایانی | توضیحات |
---|---|
createJob | این API یک کار Aggregation Service را راه اندازی می کند. برای فعال کردن کار به اطلاعاتی مانند شناسه شغل، جزئیات ذخیره سازی ورودی، جزئیات ذخیره سازی خروجی، مبدا گزارش و موارد دیگر نیاز دارد. |
getJob | این API وضعیت کار را با شناسه شغلی مشخص برمی گرداند. اطلاعاتی درباره وضعیت کار، مانند "دریافت"، "در حال انجام" یا "تمام" ارائه می دهد. اگر کار تمام شد، نتیجه کار را نیز برمیگرداند، از جمله هر پیام خطایی که در طول اجرای کار با آن مواجه میشوید. |
اسناد API Service Aggregation را بررسی کنید.
صف کار
سرویس ابری مدیریت شده: Pub/Sub (Google Cloud) / Amazon SQS (سرویس وب آمازون)
Job Queue یک صف پیام حاوی درخواست های شغلی برای سرویس Aggregation است. سرویس Frontend درخواستهای شغلی را در صف قرار میدهد، که سپس توسط کارگران جمعآوری که آنها را پردازش میکنند مصرف میشود.
ذخیره سازی ابری
سرویس ابری مدیریت شده: Google Cloud Storage (Google Cloud) / آمازون S3 (سرویس وب آمازون)
فایل های ورودی و خروجی مورد استفاده توسط سرویس تجمع، مانند فایل های گزارش رمزگذاری شده و گزارش های خلاصه خروجی، در فضای ذخیره سازی ابری نگهداری می شوند.
پایگاه داده فراداده مشاغل
سرویس ابری مدیریت شده: Spanner (Google Cloud) / DynamoDB (سرویس وب آمازون)
پایگاه داده فراداده شغلی برای ذخیره و ردیابی وضعیت مشاغل تجمیع استفاده می شود. این ابرداده مانند زمان ایجاد، زمان درخواستی، زمان بهروزرسانی و وضعیتی مانند دریافت، در حال انجام، یا پایان را ثبت میکند. Aggregation Workers پایگاه داده فراداده شغلی را با پیشرفت مشاغل به روز می کنند.
کارگر تجمع
سرویس ابری مدیریت شده: موتور محاسباتی با فضای محرمانه (Google Cloud) / خدمات وب آمازون EC2 با Nitro Enclave (سرویس وب آمازون)
یک کارگر جمعآوری درخواستهای شغلی را در Job Queue پردازش میکند و ورودیهای رمزگذاریشده را با استفاده از کلیدهایی که از سرویس تولید و توزیع کلید (KGDS) در Coordinators واکشی میکند، رمزگشایی میکند. برای به حداقل رساندن تأخیر پردازش کار، Aggregation Workers کلیدهای رمزگشایی را برای مدت 8 ساعت در حافظه پنهان نگه می دارد و از آنها در کارهایی که پردازش می کنند استفاده می کند.
کارگران تجمیع در یک نمونه محیط اجرای معتمد (TEE) عمل می کنند. یک کارگر در یک زمان تنها یک کار را انجام می دهد. میتوانید چندین کارگر را برای پردازش موازی کارها با تنظیم پیکربندی مقیاسبندی خودکار پیکربندی کنید. در صورت استفاده، مقیاس خودکار به صورت پویا تعداد کارگران را با توجه به تعداد پیامهای موجود در صف کار تنظیم میکند. شما می توانید حداقل و حداکثر تعداد کارگران را برای مقیاس خودکار از طریق فایل محیط Terraform پیکربندی کنید. اطلاعات بیشتر درباره مقیاس خودکار را میتوانید در این اسکریپتهای Terraform پیدا کنید: خدمات وب آمازون یا Google Cloud .
کارگران تجمیع برای حسابداری گزارش تجمیع با خدمات حسابداری گزارش انبوه تماس می گیرند. این سرویس تضمین میکند که مشاغل تنها در صورتی اجرا میشوند که از محدودیت بودجه حفظ حریم خصوصی تجاوز نکرده باشند. (به قانون "بدون تکرار" مراجعه کنید.) اگر بودجه در دسترس باشد، یک گزارش خلاصه با استفاده از مجموعات پر سر و صدا ایجاد می شود. جزئیات بیشتر در مورد حسابداری گزارش انبوه را بخوانید.
Aggregation Workers فراداده های شغلی را در پایگاه داده فراداده شغلی به روز می کند. این اطلاعات شامل کدهای بازگشت کار و شمارشگر خطای گزارش در صورت عدم موفقیت جزئی گزارش می باشد. کاربران می توانند با استفاده از getJob
job retrieval API وضعیت را واکشی کنند.
برای توضیحات دقیق تر از سرویس تجمیع به این توضیح مراجعه کنید.
مراحل بعدی
اکنون که میدانید سرویس جمعآوری چگونه کار میکند، نمونهای از سرویس جمعآوری را از طریق Google Cloud یا وب سرویسهای آمازون مستقر کنید. راهنمای شروع کار را ببینید.