علم و تكنولوژی

بالاخره با وب به جواب دست می یابیم. ماشین جست وجوگر اینترنت چگونه متحول می شود؟ آلتا ویستا، نشان داد كه به فهرست درآوردن تمامی حوزه وسیع اطلاعاتی وب امكان پذیر است. موفقیت گوگل …

بالاخره با وب به جواب دست می یابیم.
ماشین جست وجوگر اینترنت چگونه متحول می شود؟ آلتا ویستا، نشان داد كه به فهرست درآوردن تمامی حوزه وسیع اطلاعاتی وب امكان پذیر است. موفقیت گوگل ناشی از قدرت مرموز وی برای انتخاب صفحات مفید وب از بد است. ولی سود واقعی مطمئناً نصیب كسی خواهد شد كه از طریق وب بتواند با یك سئوال مستقیم به یك جواب درست برسد. یك محقق مایكروسافت به نام اریك بریل به نظر می رسد نخستین فردی است كه به این مهم دست یافته است. وی این مشكل را با سیستم ASK MSR حل كرده است كه برنامه جست وجوگر مایكروسافت است. این برنامه از اطلاعات صفحات وب استفاده كرده و به سئوالاتی كه جوابشان تنها یك لغت یا فریز است پاسخ می گوید. مثل مرلین مونرو، چه وقت به دنیا آمد؟ كه سیستم ASK MSR با مهارت خاصی به این سئوال از طرق گوناگون جواب می دهد.
به عنوان مثال با شناسایی افعال، سپس تغییر زمان فعل و حالت آن و قرار دادن هر یك در جای جای جمله به جواب درست دست می یابد. مثلاً مرلین، در بورن، متولد شد و یا مرلین مونرو متولد شد و همین طور .... سپس فریزهای نهایی در ماشین جست وجوگر ذخیره شده و در جاهای گوناگون جمله مورد ارزیابی قرار می گیرند و اصلاح می شوند این برنامه به نظر بی قاعده می آید ولی فریزهای بی اساس چون سازگاری كمتری با جمله دارند خود به خود كنار گذاشته می شوند.
از این رو همان طور كه دكتر بریل اشاره می كند خطاهای این برنامه بسیار ناچیز هستند. وقتی كه تعداد فریزهای به دست آمده به انبوه می رسند با ستونی از اطلاعات ثبت شده سنجیده می شوند، تا جواب نهایی به دست آید. این اطلاعات تكرار و دسته بندی می شوند به عنوان مثال جواب درست در یكی از سه مرحله نخست مشخص می شود كه این مرحله ۷۵ درصد زمان را در بر می گیرد. ممكن است خیلی خوب به نظر نیاید ولی هوش انسان فاكتور دومی است تا جواب غلط را به خوبی تشخیص داده و حذف كند.
اگر از شما بپرسند چند بار بیورن بورگ، ویمبلدون را برد برای شما عدد ۱۹۸۰ بار قابل قبول نیست ولی ۵ بار معقول به نظر می رسد. اگر به جواب شك كردید می توانید روی لیست جواب ها كلیك كنید تا جواب درست را بیابید.
ASK MSR هنوز یك نمونه اولیه است. از این رو شركت مایكروسافت برای ارتقای كیفیت آن در تلاش است كه ممكن است تحت نام Answer Bot وارد بازار شود. ضمناً دكتر بریل، كارهای بزرگ دیگری در دست دارد. از جمله رسانه ای تحت عنوان Beyond The Factoid با همكاری رادیو سوریكات از دانشگاهی در جنوب كالیفرنیا كه در آن تلاش وی را برای به وجود آوردن سیستمی كه قادر است در مقابل هر سئوال ۵۰ جواب تولید كند نشان می دهد. مثلاً چه تعداد قواعد زبانی برای توصیف كلمه Academy Awards وجود دارند؟ این سیستم سخت تر از پیدا كردن جواب های یك كلمه ای است، ولی دكتر بریل معتقد است استفاده از روشی كه «هدایت صدا» نامیده می شود بسیار عالی است. برنامه های این سیستم درستی حروف و چگونگی صداها را شناسایی می كنند. با روش تغییر شكل دادن مقصود یك كاربر (بررسی دیكته لغاتی كه وی قصد دارد تایپ كند) و آن چه كه كاربر انجام می دهد (لغت غلطی كه وی معمولاً تایپ می كند) به جواب درست دست می یابد.
به نظر می رسد كه این سیستم مثل كانال انتقال صدا در شبكه پر سر و صدای یك خط تلفن است كه صدای فردی از آن طرف خط به شكل نامفهومی دریافت می شود و یا به چیز متفاوتی تغییر می یابد.
با تجزیه و تحلیل چندین جفت دیكته درست و نادرست كلمات از روش های آماری می توان به چگونگی تغییر شكل كلمات در حالات عمومی پی برد و آن را به گونه ای بیان كرد. سیستم دیگری می تواند روند كار را بر عكس نماید. یعنی ارزیابی لغات با دیكته غلط كه برنامه جست وجو گر می تواند حدس بزند كدام لغت با دیكته غلط نوشته شده است.
برنامه سئوال و پاسخ دكتر بریل تقریباً این كار را انجام می دهد.
بسیاری از جفت سئوال و جواب ها در برنامه وب به شكل تكراری در صفحات FAQ وجود دارند. دكتر بریل با استفاده از این جفت سئوال و جواب ها برنامه خود را راه اندازی كرده است.
یك سئوال مطرح می كند و به آن جواب های گوناگون می دهد. سپس با برنامه جست وجو گر كه به صورت داده های ما در وب وجود دارند پاسخ ها را مورد ارزیابی قرار می دهند تا مواردی كه به جواب نزدیك تر است بیابند. نمونه هایی كه اكنون در بازار وجود دارند تقریباً ۴۰ درصد زمان را به سئوالات اختصاص می دهند . گرچه بسیار عالی نیستند ولی كیفیت بدی هم ندارند. هم چنان كه وب توسعه پیدا می كند آنها نیز پیشرفت می كنند. این برنامه سریع و ارزان به جای تمامی برنامه های قدیمی مثل هوش مصنوعی جهت تجزیه و تحلیل جمله برای درك مفهوم آن و وب كه پیشرفته ترین برنامه ها را دارد به كوشش دكتر بریل به وجود آمده است.
Economist, Aug.۲۰۰۴
ردموند واشنگتن (ترجمه: زهره فخریاسری)