اگر شما یک وبلاگ نویس یا مدیر سایت اینترنتی هستید،
احتمالا شنیده اید که سیستم جدید فــیـلترینگ براساس الگوریتم هوشمند تشخیص کلمات کار
می کند، به طوری که این کلمات در هر سایت یا وبلاگی که استفاده شوند توسط سیستم فــیـلترینگ
تشخیص داده شده و منجر به فــیـلتر شدن سایت یا وبلاگ مربوطه می شود.
در این بین بسیاری از نویسندگان وب با اطلاع از این موضوع و با شیوه های مختلف در صدد پیشگیری از این موضوع برآمدهاند. برخی کلمات حساس را با سایر کلمات جایگزین و یا از کاراکترهای اضافه در بین حروف این کلمات استفاده کردند تا توسط سیستم فــیـلترینگ تشخیص داده نشود. به عنوان مثال برخی واژه "فــیـلتر" را با "قــیـلتر" تعویض و یا "ســکـس" را به صورت "س.ک.ـس" می نویسند.
استفاده از این شیوهها اگرچه در بسیاری از موارد کارآمد است اما گاهی باعث دشواری هایی در خواندن اینگونه متون به خصوص برای افرادی که از این موضوع اطلاع ندارند می شود. علاوه بر آن همیشه از زیبایی و سلیسی متن نوشته شده می کاهد و گاها ممکن است نگارش عمدی املای اشتباه اینگونه کلمات موجب آسیب دیدن به زبان فارسی به خصوص در محیط اینترنت شود که در این مورد اخیرا برخی نگرانیهایی را هم مطرح کردهاند.
در اینجا قصد دارم استفاده از یک کاراکتر جایگزین را پیشنهاد کنم که علاوه بر اینکه از تشخیص اینگونه کلمات در سیستم فــیـلترینگ جلوگیری می کند، باعث هیچگونه تغییر ظاهری در شکل نوشته نمی شود.
کاراکتر "ـ" با کدپیج 1600 در سیستم یونیکد می تواند راه حل مورد نظر باشد. از این کاراکتر در اصل برای ایجاد کشیدگی مجازی (مانند "ســــــــــــلام") در بین حروف چسبان فارسی استفاده میشود اما می تواند مانند زیر برای جلوگیری از فــیـلترینگ اشتباه کلمات استفاده شود:
ف + ـ + ی + ـ + ل + ت + ر + ی + ن + گ = فـیـلترینگ
س + ـ + ـ + ک + س = ســکـس
این کاراکتر در صفحه کلید استاندارد فارسی با فشردن ترکیب کلیدهای Shift + J ایجاد می شود که از این رو استفاده از آن هم بسیار آسان میباشد.
نکته آخر هم در مورد اختلالاتی است که این شیوه می تواند در جستجوهای فارسی وب ایجاد کند که در این خصوص مسلم است که استفاده از سایر کاراکترها هم از این امر مبرا نبوده و علاوه بر آن زمانی که مشکل حروف "ی" و "ي" حل شد، این مشکل هم میتواند حل شود.
در این بین بسیاری از نویسندگان وب با اطلاع از این موضوع و با شیوه های مختلف در صدد پیشگیری از این موضوع برآمدهاند. برخی کلمات حساس را با سایر کلمات جایگزین و یا از کاراکترهای اضافه در بین حروف این کلمات استفاده کردند تا توسط سیستم فــیـلترینگ تشخیص داده نشود. به عنوان مثال برخی واژه "فــیـلتر" را با "قــیـلتر" تعویض و یا "ســکـس" را به صورت "س.ک.ـس" می نویسند.
استفاده از این شیوهها اگرچه در بسیاری از موارد کارآمد است اما گاهی باعث دشواری هایی در خواندن اینگونه متون به خصوص برای افرادی که از این موضوع اطلاع ندارند می شود. علاوه بر آن همیشه از زیبایی و سلیسی متن نوشته شده می کاهد و گاها ممکن است نگارش عمدی املای اشتباه اینگونه کلمات موجب آسیب دیدن به زبان فارسی به خصوص در محیط اینترنت شود که در این مورد اخیرا برخی نگرانیهایی را هم مطرح کردهاند.
در اینجا قصد دارم استفاده از یک کاراکتر جایگزین را پیشنهاد کنم که علاوه بر اینکه از تشخیص اینگونه کلمات در سیستم فــیـلترینگ جلوگیری می کند، باعث هیچگونه تغییر ظاهری در شکل نوشته نمی شود.
کاراکتر "ـ" با کدپیج 1600 در سیستم یونیکد می تواند راه حل مورد نظر باشد. از این کاراکتر در اصل برای ایجاد کشیدگی مجازی (مانند "ســــــــــــلام") در بین حروف چسبان فارسی استفاده میشود اما می تواند مانند زیر برای جلوگیری از فــیـلترینگ اشتباه کلمات استفاده شود:
ف + ـ + ی + ـ + ل + ت + ر + ی + ن + گ = فـیـلترینگ
س + ـ + ـ + ک + س = ســکـس
این کاراکتر در صفحه کلید استاندارد فارسی با فشردن ترکیب کلیدهای Shift + J ایجاد می شود که از این رو استفاده از آن هم بسیار آسان میباشد.
نکته آخر هم در مورد اختلالاتی است که این شیوه می تواند در جستجوهای فارسی وب ایجاد کند که در این خصوص مسلم است که استفاده از سایر کاراکترها هم از این امر مبرا نبوده و علاوه بر آن زمانی که مشکل حروف "ی" و "ي" حل شد، این مشکل هم میتواند حل شود.
+ نوشته شده در دوشنبه 17 دی1386ساعت 20:20  توسط احمد
|
