● چکیده
هدف این تحقیق، تعیین تاثیر انتخاب کلید واژه ها و خصیصه های دموگرافیک بر موفقیت در جستجوی اینترنتی از طریق تحقیق تجربی می باشد. آزمایشی بر روی 1109 نفر انجام شد که در سه قاره و در 46 موسسه آموزش عالی پراکنده بودند. روابط متنوعی در این آزمایش مورد بررسی قرار گرفت که عبارت بودند از روابط بین: تعداد کلید واژه های بکار رفته، سن، نژاد، جنسیت و میزان موفقیت در جستجو. نتایج ثابت کرد که سه مورد اول تاثیر قابل توجهی بر موفقیت در جستجو دارند در حالی که تاثیر جنسیت جزیی است.
بشر برای قرنها درگیر ذخیره سازی داده ها و اطلاعات بوده است. بازیابی موثر اطلاعات مرتبط در مدت زمانی کوتاه، همیشه یک مساله معمول تجربه شده در این حوزه به شمار می رفته است. هدف این مقاله گزارش از یک مطالعه ادبی و یک تحقیق تجربی در زمینه بازیابی اطلاعات مرتبط از اینترنت می باشد.
فعالیت در زمینه ذخیره سازی و بازیابی اطلاعات حدوداً از اوایل هزاره سوم قبل از میلاد شروع شده است. سومریها به عنوان اولین مردمی بودند که با هدف کمک به طبقات مختلف اجتماعی برای کارکرد بهتر، شروع به ذخیره سازی و رده بندی مواد نوشتاری در مجموعه کتابخانه ها کردند. فعالیتهای روزانه و ادبیات بر روی الواح گلی ثبت و در مناطق بخصوص نگهداری می شدند. این مدارک تنها دارای برچسبی بودند که شامل کلمه آغازین سند بود و این تنها روش نمایه سازی اسناد محسوب می شد. تهیه فیزیکی این برچسب های گلی، به عنوان یکی از اولین تکنولوژی ها به سمت پایه گذاری نمایه سازی محسوب می شود. این کتابخانه ها در فقدان ابزارهای تکنولوژیکی پیشرفته که بازیابی اطلاعات را ممکن سازد، بیشتر شبیه به مجموعه هایی از اسناد برچسب زده بودند.
نمایه سازی و رده بندی ساده نسخ خطی، در طی قرون وسطی انجام می شد. در نتیجه طرحهای کدگذاری و کلیدهای الفبایی که مورد استفاده قرار می گرفت، نمایه سازانی که درگیر این کارها بودند، نشیه هایی از تصوف آنها را فرا گرفته بود. فهرست نویسی در قرون وسطی با به کارگیری فهرستبرگه های دستنویس شروع شد.
عصر کامپیوترهای ابرقدرت امروزی که از طریق فهرست های مقلوب و جستجوهای خطی ایجاد شده اند، ثابت کرده است که برای قدرت بخشیدن به ذخیره سازی و بازیابی اطلاعات، بسیار به تکنولوژی محتاجیم. این تکنولوژی که قدرتش رو به افزایش است، بر مکانیسم های جستجو فشارهای اقتصادی وارد می آورد و حالا هر مشخصه و ویژگی مدرک می تواند با یک پرسش در جستجو مطابقت داده شود. در حقیقت، هم اکنون هیچ مانع تکنیکی وجود ندارد که یک نمایه را از اینکه شامل هر ویژگی از یک سند مشخص باشد، محروم کند. یک مثال اولیه از این مورد، فهرست های انجیل است. از قبیل فهرست کامل استرانگ[1] که برای اولین بار در سال 1890 منتشر شد.
● پیشینه پژوهش
تحقیقات زیادی در زمینه بازیابی اطلاعات بطور عام و بازیابی اطلاعات از اینترنت بصورت خاص، انجام شده است. بعضی از این تحقیقات در اینجا مقایسه و مرور شده اند.
● کارهای اولیه
ایده آل ترین نمایش یک سند این است که آن را نمایه سازی کنیم، اما فقدان اولیه مدارک و محدودیتهای بعدی ابزارهای تکنولوژیکی (مانند فضای ذخیره)، دستیابی به این ایده آل را غیرممکن می ساخت. در اواخر دهه 1950 و دهه 1960 میلادی، استفاده از نام نویسنده در ناحیه نمایش محتوای سند، کار برجسته ای بود. سیستم بحث برانگیز تکواژه ای، در بریتانیا و آمریکا علایق را برانگیخت و منجر به آزمایشهای کرنفیلد[2] شد که توسط کلوردون[3]، کین[4]، رابرتسون[5] و تونتا[6] مورد بحث قرار گرفت.(1996)
در این سیستم، اسناد از طریق یک اصطلاح مفرد که از عنوان سند یا چکیده آن استخراج می شد، نمایه سازی می شدند. بعد از یک سری آزمایش های برنامه ریزی شده، نتایج سیستم تکواژه ای با روشهای نمایه سازی سنتی تر که مورد استفاده بودند، مقایسه شدند. این مقایسه ظاهراً به دلیل عدم توافق در مورد قضاوت صحیح از نتایج آزمایش، شکست خورد و مباحث در این مورد بی نتیجه ماند. یک گروه از آزمایش کنندگان ادعا کردند که سیستم تکواژه ای خوب عمل می کرد در حالی که دیگران کاملاً مخالف این ادعا بودند.(الیس[7]، 1996)
سری واقعی آزمایشات در کالج ایرونتیک[8] در کرانفیلد انگلستان انجام شدند. مقایسه علمی دیگری در این زمان بین سیستم تکواژه ای و نمونه اصلاح شده رده بندی دهدهی جهانی صورت گرفت. مجموعه ای از دویست سند در مورد دانش فضانوردی استخراج شده و به عنوان مجموعه اصلی مدارک به کار گرفته شدند. سپس از میان آنها، چهل مدرک استخراج شده و برای ایجاد چهل تقاضای ساختگی بکار رفتند. فرضیه این بود که اگر سوال شماره یک مطرح شود، سند شماره یک باید به عنوان مرتبط ترین سند از مجموعه دویست سند برگزیده شود. اگرچه محدودیت های کاملا اجتناب ناپذیری در تحقیق مشهود بود، این تحقیق تاثیرگذاری سیستم تکواژه ای را فراتر از رده بندی دهدهی جهانی اثبات کرد.(همان)
این آزمایش با آزمایش کرنفیلد1[9] دنبال شد که شامل مقایسه ای میان چهار سیستم نمایه سازی متفاوت بود. در این آزمایش، از مجموعه ای شامل هجده هزار سند اصلی استفاده شد که تمام این مدارک، با هر چهار روش نمایه سازی شدند. با استفاده از همان روشی که در آزمایش قبلی بکار رفته بود، هزار و دویست تقاضا بر اساس این اسناد، طرح شد. تحقیقاتی انجام شد و موفقیت یا شکست برای هر کدام، بررسی و ذکر گردید. اجرای چهار سیستم نمایه سازی، تقریبا با سطح موفقیتی بین 8/73 تا 82 درصد انجام شد. دوباره این موضوع به اثبات رسید که سیستم تکواژه ای در مقایسه با سیستم های سنتی تر مرسوم، در یک سطح کارایی قرار دارد. بسیاری نویسندگان انتقادات گسترده ای در مقابل آزمایش کرانفیلد1 مطرح کردند که اکثر آنها از عقیده بکارگیری اسناد در طرح سوالات ساختگی، نشات می گرفت.(همانجا)
بعداً آزمایشهای دیگری که کرانفیلد2[10] نامیده می شد نیز انجام شد. این سری بررسی ها به جای اینکه تنها یک آزمایش از سیستم های نمایه سازی باشد، مبتنی بر طرح ها و زبانهای متفاوت نمایه سازی بود. بطور کلی 211 سوال تحقیقاتی از نویسندگان اصلی هر سند (از بین 1400 سند نمونه) پرسیده شد. بنابراین میزان تاثیر این آزمایش در مقایسه با کرانفیلد1 بطور واضحی مرتبط بود. این آزمایش ثابت کرد که زبانهای نمایه سازی تکواژه ای بهترین کارایی را دارند و جامعیت و مانعیت با هم دارای رابطه معکوس هستند.(همان)
دو تحقیق دیگر توسط تونتا[11] انجام شد که مطالعه سیستم بازیابی تمام متن بلیر و مارون[12] و دیگری پروژه رده بندی دهدهی دیویی پیوسته مارکی و دمیر[13] بودند. بلیر و مارون در مطالعاتشان از مانعیت و جامعیت به عنوان معیارهای عملکردی در مورد یک پایگاه اطلاعاتی چهل هزار سندی و بر اساس 51 سوال از دو حقوقدان، استفاده کردند. آنها ثابت کردند که اشکالات مربوط به جامعیت بیشتر از آنچه که مورد انتظار بود رخ داده و اینکه نسبت متوسط مانعیت و جامعیت به ترتیب 79درصد و 20درصد بود.
مارکی و دمیر نظام دهدهی دیویی را به عنوان ابزاری در جستجوی پیوسته به کار گرفتند و مشاهده کردند که هیچ رابطه ای میان مانعیت جستجوهای پیوسته و رضایت جستجو کنندگان مشاهده نشد. آزمایشاتی که در طول این پروژه تحقیقاتی انجام شد، موضوع به کارگیری تکواژه به عنوان کلید جستجو را دوباره تداعی خواهد کرد، که بواسطه آن، مقایسه های جالبی با سیستم تکواژه ای که قبلا بحث شد، فراهم خواهد آمد.
● جستجوی اینترنتی
فیدل[14](1999) و دیگران آزمایشی را برای تحلیل رفتار جستجوی اینترنتی دانش آموزان دبیرستانی در زمانی که به دنبال یافتن اطلاعات برای تکالیف خود بودند، انجام دادند. گفتگوهای شرکت کنندگان همانطور که مشغول جستجو بودند ضبط شد و به عنوان شواهدی برای یافته های بعدی بکار رفت. آنها دریافتند که جستجوگران بطور عام از نتایجشان راضی بودند اما از پاسخ دهی کند شکایت داشتند.
مطالعه دیگری توسط هیرش[15](1994) برای کشف میزان ارتباط استراتژی های جستجوی بکار رفته توسط دانش آموزان مدارس ابتدایی در حالیکه در جستجوی اطلاعات هستند، انجام شد. او دریافت که جستجوکنندگان علاقه کمی به اعتبار مطالب یافت شده نشان می دهند و وقت زیادی را صرف یافتن تصاویر می کنند. بیشتر جستجوگران هم نمی توانستند سوالات جستجوی موثری بکار ببرند. آنها همچنین عبارتهای جستجو را غلط می نوشتند و از عملگرهای بولی نیز استفاده نمی کردند. این عدم توجه به اعتبار منابع اطلاعاتی، در مطالعات گریمز[16] و بونینگ[17](2001) هم مشاهده شد. آنها متوجه شدند که دانش آموزان از منابع اینترنتی تایید نشده، استفاده می کردند و اینکه انتظارات معلمان و استفاده های واقعی دانش آموزان از منابع اینترنتی، در عمل بسیار متفاوت از یکدیگر بود.
مارسلا[18] و باکستر[19](1999) آزمایشی بر روی نیازهای اطلاعاتی و رفتارهای اطلاع یابی در انگلستان داشتند. این مطالعه شامل تعداد زیادی از منابع الکترونیکی از جمله اینترنت بود. فقط درصد کمی از پاسخ دهندگان، کاربرد کامپیوتر در ماورای روشهای سنتی (کتابها، کتابخانه ها و دوستان) را برای برآوردن نیازهای اطلاعاتیشان ترجیح می دادند، در حالیکه درصد زیادی از آنها کتابخانه را به عنوان منبع اطلاعاتی ترجیح می دادند.
لارج[20] و بهشتی[21](2000) با پنجاه دانش آموز مصاحبه کردند تا دریابند که چگونه آنها در وب به دنبال اطلاعاتشان می گردند. آشنایی این دانش آموزان با استراتژی های بازیابی اطلاعات بعد از اینکه حداقل دو روش اساسی جستجو را فرا گرفتند، افزایش یافت .
رس[22](2000) بررسی تجربی از محتوای موضوعی سوالاتی که برای موتور جستجو اکسایت[23] بکار می رفت انجام داد. از آنجا که سه یا حتی چهار بعد برای طراحی رابطه میان محتوای موضوعی لازم بود، روشن شد که شباهت درون موضوعی به مجموعه پیچیده ای از ابعاد برای توصیف نیاز دارد.
به نظر می رسد که در اینجا الگویی وجود دارد که بواسطه آن، برخی جستجوگران به جواب می رسند و برخی دیگر جستجوی ناموفقی دارند. در هر حالت، هیچ گزارشی از بروز مشکلی اساسی در جستجوی آزاد یافت نشد.
● روشهای جستجو
در هر مرحله ، جستجوی اطلاعات به یک روش شناسی ساختاری برای تضمین موفقیت جستجو نیاز دارد. حتی در گذشته که منابع الکترونیکی و اینترنتی اختراع نشده بود، انتخاب استراتژی های جستجو برای افراد، کار آسانی محسوب نمی شد.(لنکستر[24]، 1978) از آنجایی که متغیرهای فراوانی در امر جستجوی اطلاعات دخیل هستند، نمی توان به سادگی یک روش گام به گام را به عنوان متودولوژی جهت تضمین موفقیت جستجو، بیان کرد. با این وجود مارچیونینی[25](1995) قدمهایی را در بازیابی اطلاعات ذکر می کند که بین آنها روابط پیچیده ای وجود دارد:
▪ تعریف مسیله
▪ انتخاب منبع
▪ فرمول بندی سوال
▪ اجرای سوال
▪ آزمون نتایج
▪ استخراج اطلاعات
▪ انعکاس.
مطالعه اولیه فیدل(1986) بر روی جستجوی کاربران برای بازیابی اطلاعات ذخیره شده الکترونیکی، با این عقیده شروع می شد که کاربران روزی خودشان جستجو خواهند کرد. در نتیجه رواج اینترنت، جامعه اطلاعاتی یقینا به این مرحله رسیده و فرایند جستجوی اطلاعات سهل تر از گذشته شده است.
نویسنده مشابهی، مطالعه عمیقی در سال 1991 بر روی انتخاب کلیدواژه های جستجو توسط جستجوگران انجام داد که نتایج آن در سه مقاله بیان شد. در ابتدا یک مطالعه نمونه با 47 جستجوگر پیوسته حرفه ای انجام شد و ثابت کرد که یک مدل رسمی رفتار جستجو می تواند حتی با تعداد کمی از جستجوکنندگان ایجاد شود.(همانجا)
در مقاله دوم، نتایج ثابت کرد که جستجوکنندگان انتخاب کلیدواژه هایشان را بر اساس اصطلاح نامه و فهرست نامه ها پایه گذاری می کنند و اینکه جستجوهای پایگاههای اطلاعاتی چند رسانه ای، وجود اصطلاحنامه هایی با کیفیت عالی و تغییر دادن از زبانی به زبان دیگر را پیشنهاد می کند.(همانجا)
در مقاله سوم، تفاوت مهمی بین روش شناسی که جستجوکنندگان در هنگام جستجو از آن استفاده می کردند، مشاهده شد. جستجوکنندگان عملگرا تلاش می کنند که بهترین استراتژی جستجو را برای دستیابی به یک بازیابی دقیق به کار گیرند.این افراد در طول تعاملات خود، توانایی های سیستم را به حداکثر می رسانند اما فضای خاص درخواست جستجوی اصلی را فراموش نمی کنند. آنها همچنین ممکن است معنای خاص درخواست جستجوی اصلی را در تلاشی برای یافتن نتایجی بهتر، تغییر دهند.(فیدل، 2001)
نویسنده دیگری یک طرح تلفیقی را طراحی و امتحان کرد که میزان موفقیت جستجوکنندگان را افزایش می داد. آن طرح با اجازه دادن به کاربر برای تمرکز کردن بر مفاهیم - درحالیکه مسایل فنی مربوط به یک برنامه، مانند یک عملگر، را رها می کند - قابل دستیابی بود.(ویدمن[26]، 2001)
بر طبق مطالعه ای که توسط کولتا[27](1991) صورت گرفت، یک جستجوگر در طول جستجوی اطلاعات از شش مرحله با احساسات و افکار خاص که مشخصه هر مرحله است، باید عبور کند:
▪ آشنایی
▪ انتخاب
▪ اکتشاف
▪ فرمول بندی
▪ گردآوری
▪ نمایش
الیور[28] و الیور[29](1997) ثابت کردند که سطوح بالای یادگیری و اکتساب دانش در طول فعالیتهای جستجو زمانی محقق می شوند که محتوا و هدف فعالیت شناخته شده باشد. ثابت شد که درک اینکه یادگیری بطور اتوماتیک در طول جستجوی اطلاعات اتفاق می افتد، اشتباه است.
یک مطالعه تجربی توسط یوآن[30](1997) برای بررسی تاثیر سطح تجربه جستجوکنندگان بر رفتار اطلاع یابی آنها انجام شد.
رفتار اطلاع یابی گروهی از دانشجویان حقوق در طول یک دوره یکساله نمایش داده شد. او دریافت که تجربه جستجو بر جنبه هایی از رفتار آنها تاثیر داشت که این جنبه ها عبارتنداز: افزایش تسلط و مجموعه خصیصه ها، الگوی کاربرد زبان، افزایش سرعت جستجو و تغییر جنبه های یادگیری. با این وجود مقدار تجربه تاثیر مثبتی بر تعداد اشتباهاتی که روی می داد یا بر اصلاح آن اشتباهات نداشت.
لارج، تد[31] و هارتلی[32](1999) دو جنبه اساسی را برای موفقیت در بازیابی اطلاعات درست و دقیق در یک جستجوی پیوسته معرفی می کنند:
▪ تکنیک های خاص کردن جستجو زمانی که یک جستجو پاسخهای فراوانی را ارایه می کند.
▪ تکنیک های عام کردن جستجو زمانی که یک جستجو پاسخهای کم و یا هیچ پاسخ مرتبطی را ارایه نمی کند.
● عملگرها
ترکیب موتورهای جستجو بسیار باهم متفاوتند و انواع زیادی از عملگرها وجود دارند که تمرکز بر سوال جستجو را ممکن می سازند.
لنکستر به جستجوی زبان طبیعی اشاره می کند، جایی که هیچ عملگری در یک ارجاع اولیه بکار نمی رود. بعضی از عملگرهای رایج تر و پیشرفته تر از قبیل جستجوی عبارت[33] (با استفاده از نقل قولها)، عملگر مشمول کننده[34] (+)، عملگر حذف کننده[35] (-)، عملگرهای بولی[36] (AND,OR,NOT)، عملگرهای همجواری[37] (Near)، عملگر ریشه ای[38] (*) و جستجوی میدانی[39] (Domain, Title) هستند. این عملگرها توسط بسیاری از نویسندگان موردبحث قرار گرفته اند.
فرانتس[40] و دیگران(1999) مدعی اند که بیشتر سیستم های بازیابی، جستجوی بولی انجام می دهند. این نویسندگان نشان داده اند که انتقاد از این سیستم بیشتر به روش تحقیق بکار رفته برمی گردد تا خود اصول بولی. در عین حال آنها اصول بولی و دیگر اصول جستجو را از نظر اهمیت یکسان در نظر می گیرند. توصیف کاملی از کاربرد عملگرهای بولی، هم در پایگاههای اطلاعاتی عمومی و هم در موتورهای جستجوی اینترنتی، در یک کتاب درباره جستجوی اطلاعات الکترونیکی آورده شده است.(لارج، تد و هارتلی)
هیرش دریافت که در طول جستجوی اطلاعات در منابع الکترونیکی، بچه ها عموماً یا از عملگرهای بولی اصلاً استفاده نمی کند یا اینکه در حال کار، با مشکلات زیادی مواجه می شوند. در طی یک بررسی کارکردمدار[41] مربوط به سال 1996، دو سیستم جستجوی پزشکی، یک سیستم سنتی بولی و یک سیستم زبان طبیعی، با هم مقایسه شدند. در استفاده از هر دو سیستم آموزش به کاربران داده شده بود، اما هیچ تفاوت مهمی در موفقیت این دو مشاهده نشد.
بطور خلاصه، یک مطالعه جدید ادعا دارد که بیشتر مردم از اصطلاحات جستجو و سوالات اصلاح شده کمتر استفاده می کنند، صفحات وب کمتری را مشاهده می کنند و به ندرت از عملگرهای جستجوی پیشرفته استفاده می کنند.(اسپینک[42] و دیگران، 2001)
● فرمول بندی سوال
بطور کلی، بهترین راه برای ساختن سوال جستجوی مناسب در طول یک جستجوی اینترنتی، برای نیمی از جستجوکنندگان مشخص نیست. یک راه عادی برای چنین جستجوکنندگانی این است که یک یا چند کلمه پی درپی را در جعبه جستجو تایپ کنند، اما این روش در موتورهای جستجو نتایج متفاوتی را نشان می دهد. بعضی موتورهای جستجو یک عملگر (OR) بین کلمات اضافه می کنند (infoseek)، بعضی دیگر یک عملگر (And) مثل (Altavista, google) و بعضی ممکن است حتی آن را یک عبارت تلقی کنند مانند (Look smart). این سه روش مختلف نتایج کاملاً متفاوتی را بدست می دهند که بیشتر از آنکه جستجوکننده را راهنمایی کند، او را سردرگم می کند. به عنوان مثال، یک جستجوی اینترنتی که از پنج کلمه عادی با عملگر (And) بین آنها استفاده می کند، X پاسخ از یک پایگاه اطلاعاتی بازیابی می کند. همین جستجو با همان پنج کلمه و در همان پایگاه اطلاعاتی با استفاده از عملگر (OR) بین کلمات، y پاسخ بدست می دهد در حالیکه تعداد y پاسخ بسیار بیشتر از X پاسخ است.
از این مطلب مشخص شد که بسیاری از کاربران فرمول بندی سوال جستجو را مشکل تصور می کنند. لنکستر بیان کرد که این مساله از سال 1968 که کیفیت پایین فرمول بندی سوال، دلیل اصلی شکستها در جستجو بودند، وجود داشته است.
در طول بررسی که بر روی 316 کاربر صورت گرفت، اسپینک، باتمن[43] و جانسن[44] بیان کردند که تعداد کمی از کاربران از عملگرهای منطقی استفاده می کنند که تنها بخشی از این استفاده ها، صحیح و اصولی است. آنها همچنین با عبارتهای جستجو و ساختن اصطلاحات مناسب جستجو و سوالات جستجوی پیچیده مشکل داشتند.
کسلر[45](1997) در عین حال ادعا کرد که اگر به استراتژی جستجو و کاربرد صحیح طرحهای موجود توجه شود، از اینترنت می توان اطلاعات منحصربه فرد و قابل توجهی را استخراج کرد. تلاشهایی نیز انجام شد تا راه دیگری را به جستجوگران پیشنهاد دهد تا بتوانند سوالات جستجوی خودشان را بسازند. فرانتس و شاپیرو[46] الگوریتمی ساختند که بطور اتوماتیک پرسشهایی را با عملگرهای بولی می ساخت. این الگوریتم از آنجایی که پس زمینه ای را که کاربران برای تصحیح فرمول بندی پرسشها بکار می بردند می پذیرفت، انجام موفقیت آمیز جستجو را تضمین می کرد.(فرانتس و دیگران)
گاش[47] و اسمیت[48](1993) یک سیستم تخصصی را برای کمک به جستجوی پیوسته آزمایش کردند که سوالات را بطور اتوماتیک فرمول بندی می کرد و تلاش می کرد که نتایج جستجو را پیشرفت دهد. این سیستم تعداد پرسشهای موردنیاز را کاهش و دقت را افزایش می داد و رتبه بندی مرتبط را بهبود می بخشید.
در طول این پروژه، مقایسه ای بین طول کلید واژه های بکار رفته و موفقیت جستجوی اینترنتی انجام خواهد شد.
● میزان موفقیت جستجو
لنکستر در مورد عواملی بحث کرده که سالها قبل از اختراع موتورهای جستجوی اینترنتی بر میزان موفقیت جستجوی پیوسته تاثیرگذار بودند. با این وجود، اخیراً بسیاری از نویسندگان با این نظر موافقند که موافقند که کاربران باید بدانند که چگونه اطلاعات را از منابع الکترونیکی بازیابی کنند.(کرونج[49] و کلارک[50]، 1999)
تعداد زیادی از نویسندگان ادعا می کنند که یافتن اطلاعات مرتبط در اینترنت بسیار مشکل است:
▪ اخیراً، فرایند جستجو کاملا نامطلوب است.(شرمن[51]، 1999).
▪ ظاهراً بعضی پاسخ دهندگان، زمانی که در حال جستجوی لیست اصطلاحات بکار برده در جستجوهایشان بودند، سردرگم می شدند.(اسپینک، باتمن و جانسن)
▪ توانایی کاربر در مشخص کردن اصطلاحات مناسب برای جستجو و روشن کردن سوالات پیچیده جستجو، ظاهراً بسیار پایین است.(همانجا)
▪ همانطور که وب جهانگستر رشد می کند، اکتشاف و بازیابی مواد آموزشی مفید نیز بطور نامعلومی رشد می کند.(ساتن[52]، 199)
▪ فقط 33 درصد کاربران اینترنت موافق یا شدیداً موافق این گفته اند: «اجرای جستجوی موضوعی در اینترنت آسان است»)ووربیج، 1999)[53]
▪ جستجوی اطلاعات در اینترنت بسیار مشکل است.)همانجا)
▪ جستجوی اطلاعات برای دانش آموزانی که می خواهند کار پیدا کردن پاسخ مناسب یا یافتن یک وب سایت خوب را کاهش دهند، یک فرآیند پیچیده و مشکل است.(والاس[54]، کوپرمن[55] و کراژیک[56]، 2000)
▪ هم جستجوگران با تجربه و هم مبتدی ها در اعمالشان اصلاً اطمینان نداشتند.)وولفرام[57] و دیمیترف[58]، 1997)
بسیاری شواهد به این حقیقت اشاره دارند که بیشتر جستجوکنندگان وب یافتن و بازیابی اطلاعات مرتبط در اینترنت را مشکل می دانند.
● وضع کنونی
اساراسویک[59](1999) با تفکر در پنجاه سال پیشرفت در این حوزه، وضع کنونی علم اطلاع رسانی و بازیابی اطلاعات را به بهترین نحو خلاصه کرد:
▪ علم اطلاع رسانی نظمهای گوناگونی را پوشش می دهد.
▪ علم اطلاع رسانی ذاتاً با تکنولوژی اطلاعات در ارتباط است.
▪ علم اطلاع رسانی نقش فعالی در تکامل تدریجی جامعه اطلاعاتی بازی می کند.
اینگورسن[60] تعدادی دیگر از رشته هایی که بر علم اطلاع رسانی تاثیر دارند را بر می شمرد:
▪ ریاضیات و ارتباطات (با همپوشانی در تیوری اطلاعات)
▪ بوم شناسی، جامعه شناسی و زبانشناسی (با همپوشانی در زبانشناسی اجتماعی)
▪ روانشناسی، هوش مصنوعی و علم کامپیوتر.
ساراسویک سه عقیده نیرومند و اساسی که علم اطلاعات بر مبنای آنها استوار است را ذکر می کند که عبارتند از: بازیابی اطلاعات، ارتباط و تاثیر متقابل. بنابراین او بطور واضحی بازیابی اطلاعات را به عنوان بخشی از علم اطلاع رسانی رده بندی می کند.
● روش
وسیله ای برای اندازه گیری جنبه های گوناگون تجارب یک جستجوکننده طراحی، آزمایش، تصحیح و سپس بکار گرفته شد. طرحی که بکار رفت نیاز به ثبت عناصر گوناگونی درباره جستجویی که در حال انجام بوده است، داشت. بطور کلی 1109 آموزشیار از سه قاره که در بیشتر از 20 موسسه آموزش عالی پراکنده بودند در این مطالعه شرکت کردند. به هر گروه شرکت کننده 30 دقیقه وقت داده شد تا در مورد یک موضوع دانشگاهی به انتخاب خودشان و با استفاده از هر برنامه و روش که خودشان دوست دارند، جستجو کنند. هیچ راهنمایی در انتخاب موتورهای جستجو دیا عملگرها به آنها ارایه نشد.
پاسخهای تعدادی از شرکت کنندگان باید به دلیل تنوع عوامل خارجی حذف می شد. دلیل این پاسخها که به عنوان بی ارزش رده بندی شده بودند، عبارت بود از:
▪ پاسخ دهندگانی که از جستجوی کلید واژه ای استفاده نکرده بودند.
▪ اطلاعات نادرستی که پاسخهای غیرممکنی را نشان می داد.
▪ فرم هایی که ناقص بودند و بعضی از اطلاعات حیاتی در آنها وجود نداشت.
تمام 540 پاسخ دهنده باقی ماندند و نتایج فرمهای آنها، برای این مطالعه بکار رفت. بعضی داده های شخصی استاندارد در فرمها سوال شده بود از قبیل (سن، جنس، نژاد). یکی دیگر از مواردی که سوال شده بود این بود: کلید واژه هایی را که در جستجو به کار برده اید بنویسید و این مورد دیگری بود که در موفقیت جستجو موثر است. این ارزشها برای تعیین وجود یا عدم وجود رابطه بینشان بررسی شدند.
● نتایج و تجزیه و تحلیل تحقیق
از 540 پاسخ دهنده باقیمانده 372 نفر مذکر و 152نفر مونث بودند (شانزده شرکت کننده هم جنسیتشان مشخص نشده بود).
توزیع سن شرکت کنندگان از 17 تا 58 سال بود. این سنین در سه گروه طبقه بندی شده بودند. اولین گروه شامل پاسخ دهندگانی جوان تر از 20 سال (155نفر)، دومین گروه بین 25-20 سال (295) و آخرین گروه بزرگتر از 25 سال (69نفر) در نظر گرفته شد. 21نفر هم بودند که سنشان مشخص نشده بود.
توزیع نژادی عبارت بود از 97 نفر آسیایی، 77نفر دو رگه، 54 نفر سیاهپوست و 295 نفر سفید. نژادهفده نفر دیگر مشخص نشده بود.
109 نفر از پاسخ دهندگان فقط از یک کلید واژه و 431 نفر باقیمانده، بیشتر از یک کلید واژه در جستجویشان استفاده کرده بودند.
برای هر یک از این چهار عنصر (جنسیت، سن، نژاد و تعداد کلید واژه ها) تحلیلی بر روی نتایج انجام شد. سپس این تحلیل ها، ترکیب و تحلیل آماری شدند تا تاثیر آنها در جستجو برای نتیجه گیری این تحقیق مشخص شود.
● جنسیت - نتایج و تحلیل
توزیع نتایج بدست آمده از پاسخ دهندگان بر حسب جنسیت در جدول شماره 1 آمده است.
برای کلیه شرکت کنندگان، هم مذکر و هم مونث، تعداد کسانی که هیچ پاسخی نداده بودند بیشتر از کسانی بود که پاسخ قابل قبولی داده بودند.
با این وجود بدون تحلیل آماری مشخص نبود که آیا ارتباطی میان جنسیت شرکت کنندگان و میزان موفقیت جستجو وجود دارد یا خیر.
یک آزمون خی دو گسستگی نشان داد که هیچ ارتباط مهمی بین جنسیت شرکت کنندگان و یافتن نتایج با یک یا دو کلید واژه وجود ندارد.
جدول 1: توزیع نتایج بدست آمده از پاسخ دهندگان بر حسب جنسیت
مذکر/ مونث/ جمع
تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد
عدم پاسخگویی/ 219/ 87/58/ 97/ 82/63/ 316/ 99/70
پاسخ قابل قبول/ 153/ 13/41/ 55/ 18/36/ 208/ 01/29
جمع/ 372/ 00/100/ 152/ 00/10/ 524/ 00/100
● سن- نتایج و تحلیل
رابطه بین سن و موفقیت جستجو نیز ارزیابی شد. با یک بررسی سطحی نتایج مندرج در جدول شماره 2 مشخص شد که هرچه سن کاربر بالاتر باشد، احتمال پیدا نکردن یک پاسخ قابل قبول هم بیشتر است. با حرکت در میان این سه گروه سنی از جوان به پیر، میزان موفقیت از 46درصد به 39درصد و به 28 درصد کاهش پیدا می کند. تحلیل آماری بیشتری لازم بود تا این ادعا ثابت شود.
آزمون خی دو برای داده های گسسته نشان داد که رابطه مهمی بین نتایج بدست آمده و گروههای سنی شرکت کنندگان وجود دارد (احتمال = 0343/0). در نتیجه ثابت شد که احتمال اینکه پاسخ دهندگان جوانتر نتایج قابل قبولی بدست آورند، بیشتر از پاسخ دهندگان مسن تر بود.
جدول 2: توزیع نتایج بدست آمده از پاسخ دهندگان بر حسب سن
سن 19-0/ سن 25-20/ سن 25+/ جمع
تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد
عدم پاسخگویی/ 84/ 19/54/ 180/ 02/61/ 50/ 46//72/ 325/ 19/60
پاسخ قابل قبول /71/ 81/45/ 115/ 98/38/ 19/ 54/27/ 215/ 81/39
جمع/ 155/ 00/100/ 295/ 00/100/ 69/ 00/100/ 519/ 00/100
● نژاد- نتایج و تحلیل
سپس ارتباط میان موفقیت جستجو و نژاد کاربران مورد بررسی قرار گرفت. این روابط در جدول شماره 3 آورده شده است.
با بررسی نتایج مشخص شده در میان کاربران با نژادهای مختلف، آسیایی ها کمترین موفقیت را بدست آوردند (28درصد) و به ترتیب، دورگه ها 35درصد، سیاهپوستان 41 درصد و سفید پوستها بالاترین موفقیت یعنی 45 درصد را بدست آورند. با استفاده از آزمون خی دو برای داده های گسسته، مشخص شد که روابط معناداری میان نژاد کاربران و نتایج بدست آمده از جستجوی اینترنتی آنها، وجود دارد.(احتمال =0189/0). سفیدپوستها بیشتر از سیاهپوست ها، آسیایی ها و دو رگه ها به موفقیت در جستجو دست یافتند.
جدول 3: توزیع نتایج بدست آمده از پاسخ دهندگان بر حسب نژاد
آسیایی/ دورگه/ سیاهپوست/ سفیدپوست/ جمع
تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد
عدم پاسخگویی / 70/ 16/27/ 50/ 94/64/ 32/ 26/59/ 162/ 92/54/ 314/ 04/60
نتایج قابل قبول /27/ 84/27/ 27/ 06/35/ 22/ 74/40/ 133/ 08/45/ 209/ 96/39
جمع /97/ 00/100/ 77/ 00/100/ 54/ 00//100/ 295/ 00/100/ 523/ 00/100
● تعداد کلید واژه ها - نتایج و تحلیل
مقایسه چهارم و آخر، تعداد کلید واژه های بکار رفته توسط کاربران، در جدول 4 بررسی شده است. یک تحلیل سطحی نشان می دهد که تفاوت زیادی در میزان موفقیت بین کاربرانی که فقط از یک کلید واژه استفاده می کنند (میزان موفقیت کم) و کسانی که دو یا بیشتر کلید واژه بکار می برند وجود دارد. بطور تخصصی تر، بدست آوردن نتیجه قابل قبول در جستجو، زمانی که از دو یا چند کلید واژه استفاده می شود، 5/5 برابر زمانی است که یک کلیدواژه مورد جستجو قرار می گیرد.
یک آزمون خی دو برای گسستگی نشان داد که رابطه معنی داری میان تعداد کلیدواژه های بکار رفته و نتایج بدست آمده در جستجو وجود دارد. (احتمال =0228/0)
جدول4: توزیع نتایج بدست آمده از پاسخ دهندگان بر حسب انتخاب کلید واژه
تک واژه ای/ دو یا چند واژه ای/ جمع
تعداد/ درصد/ تعداد/ درصد/ تعداد/ درصد
عدم پاسخگویی/ 76/ 07/14/ 249/ 11/46/ 325/ 18/60
پاسخهای قابل قبول/ 33/ 11/6/ 182/ 77/33/ 215/ 82/39
جمع /109/ 18/20/ 431/ 88/79/ 540/ 00/100
● تحلیل ترکیبی جنسیت، سن، نژاد و کلید واژه ها
مولفان بعداً چهار عنصر را برای نتیجه گیری با هم ترکیب کردند. جدول شماره 5 نتایج رگراسیون منطقی است که با داده ها مطابقت داده شده تا معین شود کدام متغیرها برای بدست آوردن نتایج در جستجوهای اینترنتی با هم بکار رفته اند. یک انتخاب گزینشی نشان داد که تعداد کلید واژه ها، سن و نژاد گروههای پاسخ دهندگان بهترین تعیین کننده است که آیا در یک جستجوی اینترنتی نتیجه ای حاصل می شود یا خیر.
جدول 5: نتایج آماری ترکیبی
تاثیر/ DF/ Wald Chi-Square/ Pr>Chi-Square
سن/ 1/ 3400/4/ 0372/0
نژاد/ 3/ 6083/9/ 0222/0
کلید واژه/ 1/ 0727/4/ 0436/0
● نتیجه و پیشنهادات
روشن شد که خصیصه های دموگرافیک کاربران اینترنت، بر نتیجه جستجوی آنها تاثیرگذار است. آشکار است که نژاد، سن و تعداد کلید واژه ها، تاثیر قابل ملاحظه ای بر بروندادها دارند اما جنسیت اینچنین نیست. تعداد کلید واژه ها بیشترین تاثیر را دارد (کلید واژه های بیشتر میزان موفقیت بیشتری را به همراه دارد) و به دنبال آن، سن (جوانترها میزان موفقیت بیشتری را کسب می کنند) و نژاد (کاربران سفید میزان موفقیت بیشتری نسبت به دیگران کسب می کنند) در رده های بعدی قرار دارند.
مطالعات زیادی بر روی مسیله جنسیت انجام شده اما هیچکدام نتوانسته ثابت کند که جنسیت بر روی موفقیت جستجوی اینترنتی تاثیر دارد و این زمینه را برای تحقیقات آینده فراهم می کند.
تفاوت قابل توجهی در عمل بین نژادهای متفاوت وجود دارد. از آنجایی که بیشتر شرکت کنندگان در این تحقیق از افریقای شمالی بودند، تاثیر تاریخ تبعیض نژادی، احتمالاً در این تفاوت آشکارا قابل ادعاست. اگر چه چشم اندازهای سیاسی در حال تغییر است، شرکت کنندگان در این مطالعه هنوز نتایج دیدگاه آپارتاید در گذشته آنها و فقدان آموزش صحیح را با خود به یدک می کشند.
تفاوت در گروههای مختلف سنی ظاهراً نشان می دهد که کاربران جوانتر در کاربرد تکنولوژی برای دستیابی به پاسخ توانایی بیشتری دارند. در مورد کاربران جوان تر، بکارگیری کامپیوتر و اینترنت در سنین پایین باعث بوجود آمدن این برتری در دستیابی به موفقیت در جستجوی اینترنتی می باشد. مطالعات اولیه این حقیقت را آشکار کرده که محققانی که بر روی پروژه تکواژه ای کار می کردند، دریافتند نمایه هایی که از عبارتهای یک کلمه ای استفاده کرده اند، نتایج بهتری از نمایه های چند کلمه ای بدست می دهند.(رابرتسون)
نتیجه برای تعداد کلید واژه ها ظاهراً با کارهای اولیه ای که بر روی این سیستم انجام شده، در تضاد است. با این وجود سیستم تکواژه ای با روش نمایه سازی اطلاعات سر و کار دارد در حالی که این پروژه بیشتر به روش بازیابی اطلاعات می پردازد.
دلیل این تفاوتها دامنه وسیع اطلاعات موجود در اینترنت است که باعث موفقیت سیستم تکواژه ای برای سالها شده است. یک آزمایش سریع با جستجوی تک واژه ای در گوگل برای کلمه Weather 41400000 پاسخ و برای کلمه Research، 96400000 پاسخ به دست می دهد. حتی یک جستجو در مورد کلمه Information Technology ، 3580000 پاسخ داد. این موارد نشان می دهد که جستجوی تکواژه ای در اینترنت روش سودمندی نیست. تحقیقات آینده در این زمینه بر موفقیت کاربرد عبارتهای مفرد با تلفظ مشکل و منحصر به فرد نسبت به جستجوی تکواژه ای تمرکز دارد. به عنوان مثال در طول یک جستجو در گوگل، کلمات Anorexia , Derailleurهر کدام فقط 98000 و 550000 پاسخ ارایه می دهند.
بالاخره شایان ذکر است که سن، نژاد و طول کلید واژه عواملی هستند که در موفقیت جستجو نتایج آنچنان شگفت آوری به دست نمی دهند. با این وجود، این حقیقت که جنسیت، میزان موفقیت جستجو را به میزان زیادی تعیین نمی کند جالب توجه است و می تواند عنوانی برای تحقیقات بعدی باشد.
وبسایت عادل طالبی
گردآوری: سامانه تبلیغاتی آگهی 118