شناسایی و طبقه بندی موارد حساس که تحت کنترل سازمان شما هستند ، اولین قدم در رشته حمایت از اطلاعات است. Microsoft Purview سه روش برای شناسایی موارد را فراهم می کند تا بتوانند طبقه بندی شوند:
- به صورت دستی توسط کاربران
- تشخیص الگوی خودکار ، مانند انواع اطلاعات حساس
انواع اطلاعات حساس (SIT) طبقه بندی کننده های مبتنی بر الگوی هستند. آنها اطلاعات حساس مانند تأمین اجتماعی ، کارت اعتباری یا شماره حساب بانکی را برای شناسایی موارد حساس تشخیص می دهند ، به انواع اطلاعات حساس تعاریف موجودیت برای لیست کاملی از همه قسمت ها مراجعه کنید.
مایکروسافت تعداد زیادی از نشانگرهای از پیش تنظیم شده را فراهم می کند یا می توانید خود را ایجاد کنید.
اگر مشتری E5 نیستید ، می توانید تمام ویژگی های حق بیمه را در Microsoft Purview به صورت رایگان امتحان کنید. از آزمایشگاه راه حل های 90 روزه استفاده کنید تا بررسی کنید که چگونه قابلیت های دید قوی می تواند به سازمان شما کمک کند تا امنیت داده ها و نیازهای انطباق را مدیریت کند. هم اکنون در مرکز آزمایشات پورتال پورتال Microsoft Purview شروع کنید. جزئیات مربوط به ثبت نام و شرایط آزمایشی را بیاموزید.
انواع اطلاعات حساس در
دسته بندی انواع اطلاعات حساس
ساخته شده در انواع اطلاعات حساس
این قسمت ها توسط مایکروسافت به طور پیش فرض در کنسول انطباق ایجاد می شوند. این قسمت ها قابل ویرایش نیستند ، اما می توان از آنها به عنوان قالب استفاده کرد و برای ایجاد انواع اطلاعات حساس سفارشی کپی شد. برای لیست کامل همه SITS ، نوع اطلاعات حساس نوع اطلاعات را مشاهده کنید.
انواع اطلاعات حساس به موجودیت نامگذاری شده
نامگذاری شده نهاد نیز به طور پیش فرض در کنسول انطباق ظاهر می شود. آنها نام افراد ، آدرس های جسمی و شرایط و ضوابط پزشکی را تشخیص می دهند. آنها نمی توانند ویرایش یا کپی شوند. برای کسب اطلاعات بیشتر در مورد اشخاص نامگذاری شده اطلاعات کسب کنید. موجودات نامگذاری شده در دو نوع آمده است:
ناموفق
این نهادهای نامگذاری شده دارای تمرکز باریک تر هستند ، مانند یک کشور واحد یا یک کلاس واحد از اصطلاحات. در صورت نیاز به سیاست DLP با دامنه تشخیص باریک تر از آنها استفاده کنید. مشاهده کنید ، نمونه هایی از موجودیت نامگذاری شده در آن قرار دارد.
همراه
Bundled Named Entity در حال حاضر مانند همه آدرس های فیزیکی ، تمام مسابقات ممکن را در یک کلاس تشخیص می دهد. از آنها به عنوان معیارهای گسترده در سیاست های DLP خود برای تشخیص موارد حساس استفاده کنید. مشاهده کنید ، نمونه هایی از موجودیت نامگذاری شده در آن قرار دارد.
انواع اطلاعات حساس سفارشی
اگر انواع اطلاعات حساس از پیش پیکربندی شده نیازهای شما را برآورده نمی کند، می توانید انواع اطلاعات حساس سفارشی خود را ایجاد کنید که به طور کامل تعریف می کنید یا می توانید یکی از موارد داخلی را کپی کرده و آن را تغییر دهید. برای اطلاعات بیشتر، یک نوع اطلاعات حساس سفارشی در مرکز انطباق ایجاد کنید.
داده های دقیق با انواع اطلاعات حساس مطابقت دارند
همه SIT های مبتنی بر EDM از ابتدا ایجاد می شوند. شما از آنها برای شناسایی مواردی استفاده می کنید که دارای مقادیر دقیقی هستند که شما در پایگاه داده ای از اطلاعات حساس تعریف می کنید. برای اطلاعات بیشتر، در مورد انواع اطلاعات حساس بر اساس تطابق دقیق داده ها بیاموزید.
بخش های اساسی یک نوع اطلاعات حساس
هر موجودیت نوع اطلاعات حساس با این فیلدها تعریف می شود:
- نام: نحوه ارجاع به نوع اطلاعات حساس
- توضیحات: توصیف می کند که نوع اطلاعات حساس به دنبال چه چیزی است
- الگو: یک الگو مشخص می کند که یک نوع اطلاعات حساس چه چیزی را تشخیص می دهد. از اجزای زیر تشکیل شده است.
- عنصر اولیه - عنصر اصلی که نوع اطلاعات حساس به دنبال آن است. این می تواند یک عبارت منظم با یا بدون اعتبار سنجی، فهرست کلمات کلیدی، فرهنگ لغت کلمه کلیدی یا تابع باشد.
- عنصر پشتیبان - عناصری که به عنوان شواهد پشتیبانی عمل می کنند که به افزایش اعتماد به نفس در مسابقه کمک می کند. به عنوان مثال، کلمه کلیدی "SSN" در مجاورت یک شماره SSN. این می تواند یک عبارت منظم با یا بدون اعتبار سنجی، فهرست کلمات کلیدی، فرهنگ لغت کلمات کلیدی باشد.
- سطح اطمینان - سطوح اطمینان (بالا، متوسط، پایین) نشان دهنده میزان شواهد پشتیبان به همراه عنصر اصلی است. هرچه شواهد پشتیبان یک مورد بیشتر باشد، اطمینان بیشتری وجود دارد که یک مورد منطبق حاوی اطلاعات حساسی است که شما به دنبال آن هستید.
- نزدیکی - تعداد کاراکترها بین عنصر اصلی و پشتیبانی.
در این ویدیوی کوتاه درباره سطوح اعتماد به نفس بیشتر بدانید.
نمونه نوع اطلاعات حساس
شماره هویت ملی آرژانتین (DNI).
قالب
هشت رقم با نقطه از هم جدا شده اند
الگو
- دو رقمی
- یک دوره
- سه رقمی
- یک دوره
- سه رقمی
چک جمع
تعریف
یک خطمشی DLP اطمینان متوسطی دارد که این نوع اطلاعات حساس را شناسایی میکند اگر در مجاورت 300 کاراکتر:
- عبارت منظم Regex_argentina_national_id محتوایی را پیدا می کند که با الگو مطابقت دارد.
- یک کلمه کلیدی از Keyword_argentina_national_id پیدا شد.
کلید واژه ها
کلمه کلیدی_آرژانتین_ملی_شناسه
- شماره هویت ملی آرژانتین
- هویت
- شناسنامه کارت ملی
- DNI
- NIC ثبت ملی اشخاص
- Documento nacional de identidad
- Registro nacional de las personas
- یدک
- مشخصات
اطلاعات بیشتر در مورد سطح اعتماد به نفس
در یک تعریف موجودیت از نوع اطلاعات ، سطح اعتماد به نفس نشان می دهد که علاوه بر عنصر اصلی ، شواهد پشتیبانی کننده چقدر شناسایی می شود. هرچه شواهد و مدارک پشتیبانی کننده تری داشته باشد ، اعتماد به نفس بیشتری که یک مورد همسان حاوی اطلاعات حساس مورد نظر شما است ، بیشتر است. به عنوان مثال ، مسابقات با سطح اطمینان بالا حاوی شواهد پشتیبانی بیشتری در مجاورت عنصر اصلی است ، در حالی که مسابقات با سطح اطمینان کم حاوی شواهد و مدارک پشتیبانی کمی در نزدیکی هستند.
سطح اطمینان بالا کمترین مثبت کاذب را برمی گرداند اما ممکن است منجر به منفی های دروغین شود. سطح اعتماد به نفس پایین یا متوسط ، مثبت های کاذب بیشتری را برمی گرداند اما تعداد کمی به صفر منفی کاذب است.
- اعتماد به نفس کم: موارد همسان حاوی کمترین منفی کاذب اما کاذب ترین مثبت است. اعتماد به نفس کم تمام مسابقات اعتماد به نفس کم ، متوسط و بالا را برمی گرداند. سطح اعتماد به نفس کم ارزش 65 دارد.
- اعتماد به نفس متوسط: موارد همسان حاوی مقدار متوسط مثبت کاذب و منفی کاذب است. اعتماد به نفس متوسط تمام مسابقات اعتماد به نفس متوسط و بالا را برمی گرداند. سطح اطمینان متوسط دارای ارزش 75 است.
- اعتماد به نفس بالا: موارد همسان حاوی کمترین مثبت کاذب اما دروغین ترین منفی است. اعتماد به نفس بالا فقط مسابقات اعتماد به نفس بالایی را برمی گرداند و ارزش 85 دارد.
شما باید از الگوهای سطح اعتماد به نفس بالا با تعداد کم ، مثلاً پنج تا ده و الگوهای اعتماد به نفس کم با تعداد بالاتر استفاده کنید ، مثلاً 20 یا بیشتر.
اگر خط مشی های موجود یا انواع اطلاعات حساس سفارشی (SITS) را با استفاده از سطح اطمینان مبتنی بر شماره تعریف کنید (همچنین به عنوان دقت می دانید) ، آنها به طور خودکار به سه سطح اطمینان گسسته ترسیم می شوند. اعتماد به نفس کم ، اعتماد به نفس متوسط و اعتماد به نفس بالا ، در سراسر مرکز امنیت @ UI.
- تمام خط مشی ها با حداقل دقت یا الگوهای SIT سفارشی با سطح اطمینان بین 76 تا 100 به اعتماد به نفس زیاد ترسیم می شوند.
- تمام خط مشی ها با حداقل دقت یا الگوهای SIT سفارشی با سطح اطمینان بین 66 تا 75 با اعتماد به نفس متوسط ترسیم می شوند.
- تمام خط مشی ها با حداقل دقت یا الگوهای SIT سفارشی با سطح اطمینان کمتر از یا مساوی 65 برای اعتماد به نفس کم ترسیم می شوند.
ایجاد انواع اطلاعات حساس سفارشی
می توانید از چندین گزینه برای ایجاد انواع اطلاعات حساس سفارشی در مرکز انطباق انتخاب کنید.
از رابط کاربری استفاده کنید - می توانید یک نوع اطلاعات حساس سفارشی را با استفاده از رابط کاربری مرکز انطباق تنظیم کنید. با این روش می توانید از عبارات منظم، کلمات کلیدی و دیکشنری کلمات کلیدی استفاده کنید. برای کسب اطلاعات بیشتر، به ایجاد نوع اطلاعات حساس سفارشی مراجعه کنید.
از EDM استفاده کنید - می توانید انواع اطلاعات حساس سفارشی را با استفاده از طبقه بندی مبتنی بر تطابق داده های دقیق (EDM) تنظیم کنید. این روش شما را قادر می سازد تا با استفاده از یک پایگاه داده ایمن یک نوع اطلاعات حساس پویا ایجاد کنید که می توانید به طور دوره ای آن را بازخوانی کنید. به اطلاعاتی درباره انواع اطلاعات حساس مبتنی بر تطابق دقیق داده ها مراجعه کنید.
استفاده از PowerShell - می توانید انواع اطلاعات حساس سفارشی را با استفاده از PowerShell تنظیم کنید. اگرچه این روش پیچیده تر از استفاده از رابط کاربری است، اما گزینه های پیکربندی بیشتری دارید. به ایجاد یک نوع اطلاعات حساس سفارشی در Security & Compliance PowerShell مراجعه کنید.
سطوح اطمینان بهبودیافته برای استفاده فوری در سرویسهای پیشگیری از دست دادن داده، حفاظت از اطلاعات، انطباق با ارتباطات، مدیریت چرخه عمر دادهها و مدیریت سوابق برای استفاده فوری در دسترس است. حفاظت اطلاعات اکنون از زبانهای مجموعه کاراکتر دو بایتی برای موارد زیر پشتیبانی میکند:
- زبان چینی ساده شده)
- چینی (سنتی)
- کره ای
- ژاپنی
این پشتیبانی برای انواع اطلاعات حساس در دسترس است. برای اطلاعات بیشتر به پشتیبانی حفاظت از اطلاعات برای مجموعه کاراکترهای دو بایتی، یادداشتهای انتشار را ببینید.
برای تشخیص الگوهای حاوی نویسههای چینی/ژاپنی و نویسههای تک بایتی یا تشخیص الگوهای حاوی چینی/ژاپنی و انگلیسی، دو نوع کلمه کلیدی یا regex را تعریف کنید.
- به عنوان مثال، برای شناسایی یک کلمه کلیدی مانند "机密的 document"، از دو نوع کلمه کلیدی استفاده کنید. یکی با فاصله بین متن ژاپنی و انگلیسی و دیگری بدون فاصله بین متن ژاپنی و انگلیسی. بنابراین، کلیدواژه هایی که باید در SIT اضافه شوند باید «سند 机密的» و «机密的 document» باشند. به طور مشابه، برای تشخیص عبارت "東京オリンピック 2020"، باید از دو نوع استفاده شود."東京オリンピック 2020" و "東京オリンピック 2020".
همراه با کاراکترهای چینی/ژاپنی/دو بایتی، اگر فهرست کلمات کلیدی/عبارات همچنین حاوی کلمات غیرچینی/ژاپنی نیز باشد (مثل فقط انگلیسی)، باید دو فرهنگ لغت/فهرست کلمات کلیدی ایجاد کنید. یکی برای کلمات کلیدی حاوی کاراکترهای چینی/ژاپنی/دو بایتی و دیگری فقط برای انگلیسی.
- به عنوان مثال، اگر می خواهید یک فرهنگ لغت/فهرست کلیدواژه با سه عبارت "بسیار محرمانه"، "機密性が高い" و "机密的 document" ایجاد کنید، باید دو لیست کلیدواژه ایجاد کنید.
- بسیار محرمانه
- 機密性が高い، 机密的 سند و 机密的 سند
در حالی که ایجاد یک رژکس با استفاده از یک هیفن دو بایت یا یک دوره بایت دوتایی ، حتما از هر دو شخصیت مانند یک شخص فرار کنید یا در یک رژیم فرار کنید. در اینجا یک نمونه Regex برای مرجع وجود دارد:
توصیه می کنیم به جای Word Match در لیست کلمات کلیدی استفاده کنید.
در انواع اطلاعات حساس ، بازخورد صحت مطابقت را ارائه دهید
شما می توانید تعداد مسابقات SIT را در انواع اطلاعات حساس و Explorer محتوا مشاهده کنید. همچنین می توانید بازخوردی در مورد اینکه آیا یک مورد در واقع یک مسابقه است یا از مسابقه استفاده نمی کند ، نه یک مکانیسم بازخورد مسابقه و از آن بازخورد برای تنظیم قسمت های خود استفاده کنید. برای کسب اطلاعات بیشتر ، دقت طبقه بندی کننده (پیش نمایش) را مشاهده کنید.
برای اطلاعات بیشتر
برای یادگیری نحوه استفاده از انواع اطلاعات حساس برای رعایت مقررات مربوط به حفظ حریم خصوصی داده ها ، به استقرار اطلاعات مربوط به مقررات حفظ حریم خصوصی داده ها با مایکروسافت 365 (aka. ms/m365dataprivacy) مراجعه کنید.< Span> در حالی که یک رژیم با استفاده از یک هیفن دوتایی یا یک دوره دوتایی بایت ایجاد می کند ، حتما از هر دو شخصیت مانند یک شخص فرار کنید یا در یک دوره در یک رژیم فرار کنید. در اینجا یک نمونه Regex برای مرجع وجود دارد: