در مقاله قبلی موضوع احراز هویت از روی امضاهای دستنویس (HSV) را به دو دسته آفلاین یا ایستا (عکس از امضا) و آنلاین یا پویا تقسیم کردیم. در ادامه و در این مقاله، در مورد نوع دوم صحبت میکنیم. با توجه به ماهیت پویا امضا، به خوبی روشن است که هیچ دو امضای یک فرد کاملاً یکسان نیستند و امضاهای پیدرپی یک شخص هم به صورت کلی و هم به صورت محلی متفاوت هستند و اندازه و جهت آنها نیز تفاوت میکند. به علاوه با توجه به قطعه قطعه بودن امضاهای افراد و حتی تفاوت در تعداد قطعات امضای یک فرد با توجه به شرایط مختلف و وسایل دریافت امضا، مقایسه امضاها برای تصدیق را به کاری مشکل تبدیل کرده است.
دستخط و امضا یک فرایند آموزشیافته است که در طول سالها و با تمرین زیاد آموزش یافته است. امضا دنبالهای از ضربات پیوسته و متوالی قلم است که تشکیل منحنیهای خاصی را داده و در نهایت منجر به شکلی با معنی تحت عنوان امضا میشود. این ضربات و منحنیها در نتیجه حرکات قلم-پایین و یا قلم-بالای قلم ایجاد میشوند. حرکت قلم- پایین بهصورت حرکت قلم بر روی کاغذ و تماس آن با کاغذ برای رسم یک خط تعریف میشود. این حرکت در مقابل حرکت قلم- بالا است که در آن قلم در بالای کاغذ و بدون تماس با آن حرکت میکند. نوشتن همیشه با یک حرکت قلم-پایین شروع شده و با دنباله ای یک در میان از حرکات قلم-بالا و قلم-پایین قلم ادامه مییابد. استروک یکی از لغات کلیدی تصدیق امضای دستنویس است.
در تحقیقات مختلف، لغت استروک را با مفاهیم مختلف به کار بردهاند. دنباله ای از استروکها امضا را تشکیل میدهند. در حالت کلی استروک دنبالهای از مولفههای اساسی است که به وسیله وقفههای ناگهانی از دو طرف محدود شده است. اگر چنین استروکی را درجهت y در نظر بگیریم (فرض کنید استروک از یک مقدار کوچک y شروع و به یک مقداربزرگ ختم شود). فعلاً جابجایی در جهت x را در نظرنگیرید چون با این تغییرات نیز میتوان به صورتی مشابه برخورد کرد. اگر سرعت در جهت y در طول این استروک بررسی شود میتوان دید که مقدارسرعت از یک مقدار مثبت شروع شده به تدریج بزرگتر شده تا به یک مقدار حداکثر میرسد. این مقدار حداکثر در اواسط استروک اتفاق میافتد.
پس از آن مقدار سرعت به تدریج کم میشود. بنابراین شکل نمودار سرعت حالتی موجی دارد. این نمودار به شکل یک منحنی زنگوله شکل است که از سرعت صفر شروع شده سپس به یک حداکثر رسیده و در انتها به سرعت صفر ختم میشود. در منابع مختلف تعاریف متفاوتی از استروک شده است، دربرخینوشتهها استروک به معنی واحدهای اولیه نوشتاری و دربسیاری از جاها به معنی یک حرکت کامل و پایین قلم عنوان شده است. به عبارتی استروک را همان حرکت ابتدائی قلم_پایین قلم و یک حرکت پایین کامل قلم اطلاق میکنند که از دوسو به وسیله دو حرکت قلم_بالای قلم محدود شده است، چیزی که به صورت قطعه (سگمنت) هم تعریف میشود.
اخذ و جمعآوری امضا
تصدیق امضا مشابه هر کار تشخیص الگوی دیگر، نیاز به ایجاد یک پایگاهداده برای آموزش و تست دارد. ایجاد چنین دادههایی از امضاهای آزمایشی که بیانکتتده کاربردهای دنیای واقعی باشد کاربسیار مشکلی است چون به سختی میتوان افرادی را یافت که حاضر به قبول این امر باشند که امضاهای آنها روی یک کامپیوتر ذخیره شود و یا در اختیار کسی قرار گیرد تا او برای جعل آن تمرین کند. بههمین دلیل اکثر پایگاهدادههای آزمایشی با استفاده از امضاهای افراد داوطلب و نزدیک به گروه تحقیقاتی شکل میگیرد و یا یک امضای غیرواقعی فرد را دارند.
نوشتن بر روی کاغذ منجر به تصویری میشود که حاوی اطلاعات ایستای دستنوشته است. به این ترتیب اطلاعات پویای دست نوشته مثل فشار، کجی قلم و اطلاعات دینامیک زمانی آن از بین میرود. با این وجود متخصصان امضا و تحلیل اسناد میتوانند برخی از اطلاعات زمانی امضا را از روی تصویر آن استخراج کنند. میتوان با بکار بردن قلم خاصمنظوره و یک دیجیتایزر مجهزشده برای این منظور، به هر دو وجه اطلاعات پویا و ایستای امضا دسترسی پیدا کرد. برخی ابزارهای موجود میتوانند اطلاعاتی مثل موقعیت افقی و عمودی، فشار و میزان کجی را در هرلحظه از نوشتن یا امضاکردن دراختیار گذارند.
دیجیتایزرهای استفاده شده برای جمع آوری دادهها به صورت یک تبلت با اندازههای مختلف همراه با یک قلم هستند. بسته به نوع تبلت میتوان اطلاعاتی مانند مختصات افقی و عمودی، فشار وارده بر قلم و میزان زاویه کجی قلم اندازه گرفت. با استفاده از سرعت نمونه گیری این وسایل میتوان به اطلاعات دینامیک زمانی مانند سرعت و شتاب نیز دست یافت. دنبالهای از نمونهها که از تبلتها در فواصل زمانی مساوی به دست میآیدبه صورت زیر هستند:
- (x(t مختصات افقی x میباشد که در زمان t نمونه گیری شده است.
- (t)y مختصات عمودی y میباشد که در زمان t نمونه گیری شده است.
- (t)p فشار محوری وارد بر قلم در زمان t میباشد.
- θ(t) میزان زاویه کجی قلم در زمان t است.
میتوان از مقادیر بالا مشتق مرتبه اول و دوم دنباله (x,y) را محاسبه کرده و سرعت و شتاب فرآیند امضا درهر لحظه را به دست آورد.
پیش پردازش امضاها
پیشپردازش شامل انجام برخی پردازشهای اولیه روی امضاها قبل و یا در حین استخراج ویژگیهاست. از مهمترین روشهای پیش پردازش میتوان به نرمالیزه کردن، هموار سازی (Smooting) و نمونهگیری مجدد (Resampling) اشاره کرد. در نرمالیزه کردن (Normalization) معمولا اندازه امضا را در راستای افقی یا عمودی و در مواردی در هر دو حالت نرمال میکنند. این مساله باعث عدم تغییر در مقابل مقیاس و حذف مقیاس میشود اما این مساله به نوعی حذف یک ویژگی است چراکه برخی از افراد همیشه اندازه امضای کوچک یا بزگ تری نسبت به دیگران دارند.
هموارسازی منجر به حذف تغییرات شدید لبههای امضا ناشی از خطای کوانتیزه کردن میشود. این کار به کمک فیلترهایی مانند فیلتر گاوسی انجام میگیرد. نمونهگیری مجدد روشی برای افزایش یا کاهش تعداد نمونههای امضا است. در برخی از روشها مانند مقایسه رشتهها برای مقایسه امضاها نیاز به هم طول کردن دو امضا دارند که در این موارد با افزودن تعدادی نمونه به امضای با طول کمتر آنرا با امضای دیگر هم طول میکنند.
به علاوه گاهی برای جبران نرخ پایین نمونه برداری وسیله ثبت امضا این کار انجام میشد که امروزه با توجه به دقت وسایل ثبت امضا و نرخ بالای نمونهگیری آنها این مساله منتفی است. برعکس، گاهی به علت نرخ بالای نمونه برداری و یا سرعت کند در امضا کردن، ممکن است دو یا چند نمونه در زمانهای مختلف پیاپی نقاط یکسانی را ثبت کنند که در این صورت این افزونگیها باید خذف گردند. در این کار فقط از نوع اخیر پیشپردازش استفاده شده است.
استخراج و انتخاب ویژگیها
در هر مساله تشخیص الگو، استخراج و انتخاب ویژگیها یکی از مسائل اساسی و تعیینکننده در کارایی و نتایج آن، مستقل از نوع روش استفاده شده است. با بررسی کارهای انجامشده درزمینه تصدیق امضای پویا میتوان سه نوع دسته ویژگی مختلف را مشخص کرد.
- ویژگیهای سراسری
- ویژگیهای مبتنی بر تکتک نقاط امضا
- ویژگیهای مبتنی بر قطعات امضا
ویژگیهای سراسری، ویژگیهایی هستند که به صورت سراسری از تمامی امضا استخراج شدهاند. ویژگیهای مبتنی بر تکتک نقاط امضا ویژگیهایی هستند که برای تمامی نقاط امضا جداگانه محاسبه میشوند. برای محاسبه ویژگیهای مبتنی بر قطعات امضا ابتدا امضا به دنبالهای از قطعات شکسته شده و سپس برای هر قطعه ویژگیها محاسبه میشود.
بیشتر روشهای تصدیق امضا از مجموعهای از ویژگیهای سراسری برای ساختن مدل مرجع استفاده میکنند. اغلب روشهای اختصاصا طراحیشده و اولیه برای تصدیق امضای دستنویس از این نوع ویژگیها استفاده کردهاند. ویژگیها باید نسبت به تغییرات اندازه و سرعت امضاهای حقیقی حساس نباشند. برای تشریح ویژگیهای سراسری ابتدا باید برخی از اختصارات بهکاررفته در عبارات تعریفکننده این ویژگیها تعریف و تشریح شوند.
با در نظر گرفتن اختصارات فوق، ویژگیهای سراسری در زیر فهرست شدهاند. بردار ویژگیهای محاسبهشده در این جدول دارای طول ثابتی برای تمامی امضاها میباشد.
در ویژگیهای مبتنی بر تکتک نقاط امضا، دسته ویژگی محاسبهشده برای هر امضا متشکل از یک بردار مقادیر برای هر نقطه امضا است. از روی مختصات افقی و عمودی هر نقطه تصویر امضای پیشپردازش شده، تعدادی ویژگی محلی استخراج میشود که به دو دسته ویژگیهای زمانی و مکانی تقسیم میشوند.
ویژگیهای مکانی ویژگیهایی ایستا بوده و از روی شکل امضا استخراج میشوند. تا حد زیادی میتوان این ویژگیها را با استفاده از شکل امضا و بدون نیاز به مشخصات پویای امضا محاسبه کرد. ولی با این وجود برای محاسبه هر دو دسته ویژگیهای یادشده باید اطلاعات زمانی و ترتیب زمانی نقاط مختلف امضا دردسترس باشد. برخی از این ویژگیها به صورت زیر هستند. هرچند میتوان ویژگیهای نقطهای بیشتری را نیز بدست آورد، اما این ویژگیها به نوعی بقیه را پوش میدهند.
انطباق زمانی پویا (DTW) برای مقایسه دو امضا
روش انطباق زمانی پویا یا DTW، سعی میکند که دو دنباله X و Y را، که از لحاظ کشش زمانی متفاوتند، با هم منطبق کرده و فاصله بین آن دو را به دست آورد. این روش معمولاً در پردازش گفتار برای مقایسه دو الگوی گفتاری مورد استفاده قرار میگیرد. با توجه به شباهت دینامیک گفتار و امضا، برای تصدیق امضا هم از این روش جهت مقایسه دو امضای با دنباله مولفههای X و Y استفاده میشود. در این حالت فرض میکنیم برای دو امضای X و Y ، دنباله نمونهها یا ویژگیهای آن به صورت زیر استخراج شدهاند.
که در آن xi و yi بردارهای ویژگی i از امضا میباشند. طول زمانی دنبالههای X و Y (یعنی Tx و Ty) لزوماً برابر نیست. هدف این است که فاصله دو دنباله X و Y را به دست آوریم. برای این منظور با استفاده از توابع انطباق سعی میشود که مؤلفههایی از دو دنباله را انتخاب کرده و فاصله آنها را به دست آورده طوری که مجموع فواصل به دست آمده مینیمم ممکن باشد. «توابع انطباق»، اندیس مؤلفههای دو دنباله X و Y را به یک زمان نرمال مشترک مانند k مرتبط میسازند:
با استفاده از این دو تابع، فاصله دو دنباله را به صورت زیر تعریف میکنیم:
فاصله دو دنباله X و Y با همین مینیمم فاصله مشخص میشود:
برای این منظور باید تمام توابع انطباق ممکن در رابطه بالا را امتحان کنیم و هر کدام را که جواب مینیمم دادند، انتخاب کنیم. دو دنباله X و Y نسبت به هم یک شبکه تشکیل میدهند و توابع φx و φy مسیری را در میان این شبکه مشخص میکنند که بردارهای امضاها را که باید با هم مقایسه شوند، تعیین میکند. هدف پیدا کردن مسیری است که مینیمم هزینه را داشته باشد. برای پیدا کردن مسیر بهینه، از روش برنامه ریزی پویا استفاده میشود. شکل زیر مثالی از شبکه تشکیل شده از دو دنباله X و Y و یک مسیر در میان این شبکه را نشان میدهد.
شکل 1- شبکه تشکیل شده برای انطباق دو دنباله امضا و یک نمونه از مسیر انطباق
نویسنده: هادی ویسی – شرکت سپید سیستم شریف (دی 1399)
خیلی خوب بود