مقاله جستجوی پیشرفته در اینترنت


دنلود مقاله و پروژه و پایان نامه دانشجوئی

مقاله جستجوی پیشرفته در اینترنت مربوطه  به صورت فایل ورد  word و قابل ویرایش می باشد و دارای 34  صفحه است . بلافاصله بعد از پرداخت و خرید لینک دانلود مقاله جستجوی پیشرفته در اینترنت نمایش داده می شود، علاوه بر آن لینک مقاله مربوطه به ایمیل شما نیز ارسال می گردد

 فهرست مطالب

مقدمه:   2
مباحثي عميق تر در باب جستجو در اينترنت   2
ماشين جستجو گر چگونه كار مي كند؟   3
پيش بيني ربط   4
عوامل دروني   4
عوامل بيروني   4
محتويات ماشين جستجوگر   5
وجوه تمايز ماشين هاي جستجوگر   6
جستجو بر اساس موقعيت كلمه در سند   8
جستجو بر اساس نوع فايل   9
روشهاي ارائه نتايج   9
نحوه رتبه بندي اسناد وب توسط ماشين هاي جستجوگر   10
راههاي هل دادن صفحه وب به رده هاي بالاتر   10
اندازه گيري محبوبيت صفحه   13
منابع دیگر برای تعیین محبوبیت لینکی   13
آموزش جستجو در شبکه اینترنت   17
معرفی مهمترین موتورهای جستجو در اینترنت   21
ارزیابی عملکرد موتورهای جستجو   32
منا بع و ماخذ:   33

مقدمه:

كاربري كه وارد اينترنت مي شود با تنوع رنگارنگ و چشم گيري از سايت هاي متنوع روبرو مي شود و با هيجان و علاقه با موس خود بر لينكهاي جذاب اشاره مي كند تا سايت هاي جديدتر و جالب تر كشف كند…. اما اين طراح يا مدير سايت است كه با زحمت و هزينه آن را طراحي و برنامه نويسي كرده، بر اينترنت نصب نموده و حال مشتاقانه به انتظار نشسته تا كاربران و يا در واقع مشتريان احتمالي، با كليك هاي تصادفي خود وارد سايت او شوند.

اما دليلي ندارد كه اين انتظار بطور انفعالي و يا با توسل به دعا و نذر بگذرد، زيرا نكات و ريزه كاريهاي زيادي است كه به مديران وب سايت امكان آن را مي دهد در بازار پر رقيب اينترنت سايت خود را عرضه و ارتقاء دهند و پايه و زير بناي اعمال اين گونه ريزه كاريها، دانشي عميق و كارا از طرز جستجوي ماشين هاي جستجوگر كه ابزار اصلي هر كاربر اينترنت به مشار مي روند، است.

مباحثي عميق تر در باب جستجو در اينترنت

اگر چه مبحث جستجو در اينترنت از نظر مفهومي ساده به نظر مي رسد،‌ اما در عمل به وسعت و پيچيدگي شبكه اينترنت، مسائل و معضلات خاص خود را به همراه دارد. اگاهي از اين مسائل براي كساني كه به طور جدي خواهان استفاده از اينترنت هستند (يعني مثلا مي خواهند براي خود وب سايتي را – حقوقي يا حقيقي- نصب و از آن به عنوان يك ابزار قوي اطلاع رساني استفاده كنند) واقعا لازم است. امروزه ديگر فقط حضور داشتن در اينترنت و نصب يك وب سايت اطلاعات كافي نيست بلكه بايد سعي كرد به طور فعالانه مخاطبين و يا در حقيقت بازديدكنندگان بيشتري را به وب سايت خود جذب نمود. ارائه اطلاعات در اينترنت تنها زماني مفيد است كه كاربران و جستجوگران و محققان اينترنت از وجود اين اطلاعات، اگاه، و حاضر باشند وقت و منابع كامپيوتري خود را صرف بازديد از وب سايت حاوي آن اطلاعات نمايند. روشهاي گوناگون ارتقاء وب سايت در شبكه اينترنت مساله اي است كه هم اكنون ذهن و قواي بسياري از متخصصين اينترنت را مشغول كرده است زيرا امروزه ديگر در اين مورد كه اينترنت يك رسانه بسيار قوي اطلاع رساني است ترديدي وجود ندارد بلكه مساله اصلي، آن است كه چگونه مي توان با ايجاد استراتژيهاي موثرتر براي انجام جستجوهاي بهينه و سريع، اطلاعات موجود در وب سايتها را به بهترين نحو ارائه داد. يك شركت، دانشگاه، تاجر، محقق، كتابخانه، خطاط و يا نمايشگاه به راحتي مي تواند با صرف هزينه اي مشخص وب سايتي براي خود طرح و در اينترنت نصب نموده و ظرفيت هاي خدماتي و توليداتي خود را معرفي كند اما چگونه مي تواند مطمئن باشد كه تمام مخاطبيني كه ممكن است اين وب سايت برايشان جالب باشد از وجود آن آگاهي پيدا كرده و از آن بازديد به عمل مي آورند و در نهايت خدمات آنها را بر مي گزينند؟ اهميت اين سئوال هنگامي روشن مي شود كه انبوه وب سايتهاي متنوع و رقيب دراينترنت را به خاطر بياوريم.

در چنين بازار آشفته اي كه هيچ معياري براي ارزيابي جز سليقه شخصي بر آن حكمفرما نيست، لازم است هر كس كه مي خواهد به نحوي نامش در اينترنت مطرح شود نكات و راهنمايي هاي تكنيكي و منطقي خاصي را به كار بندد تا تلاش او براي عرضه اطلاعات بي نتيجه نماند و بهترين بازدهي را برايش داشته باشد.

گرافيستي را در نظر بگيريد كه براي خود يك وب سايت طرح و در اينترنت نصب كرده باشد. اين وب سايت ممكن است شامل نمونه هايي از كار خود، اطلاعات تماس، تخصص هاي ويژه و مسائل مربوط ديگر باشد. آنچه براي اين گرافيست اهميت دارد اين است كه، كسي که به دنبال خدمات گرافيكي مي گردد بتواند زودتر به وب سايت او برسد. به عبارت ديگر و عملي تر، هنگامي كه كسي عبارتي چون “خدمات گرافيكي” را به ماشين جستجوگر معتبي چون Alta Vista يا  Lycos وارد مي كند، سايت وي در فهرست نتايج حتما موجود باشد تا بدين ترتيب، ‌جوينده بتواند آن را مشاهده و انتخاب كند.

پس در واقع دو عامل اصلي در اجراي موثرتر و بهتر جستجوها دخيل هستند: اول ساختار خود ماشين جستجوگر (يعني اينكه اصولا نرم افزار آن چگونه كار مي كند و كدام سايتها را برمي گزيند.) و ديگري خود وب سايت، و اينكه از چه اصولي بايد پيروي كند تا در جستجوها مطرح شود و ترجيحا با يك رتبه بالا معرفي گردد.

ماشين جستجو گر چگونه كار مي كند؟

ماشين جستجوگر در حقيقت يك بانك اطلاعات از منابعي است كه طي يك فرآيند كاوشگرانه اتوماتيك از اينترنت استخراج شده اند. اين بانك، از طريق پرسشهاي كاربران قابل جستجو است؛ بدين ترتيب كه كلمات يا عباراتي كه كاربر در ناحيه مخصوص جستجو (Search Box) وارد مي كند با منابعي از بانك اطلاعات كه حاوي آن عبارات يا كلمات هستند تطبيق داده مي شوند. سپس اين منابع بر اساس ربطي كه با پرسش  كاربر مي توانند داشته باشد مرتب و ارائه مي شوند؛ به طوري كه سايت هايي كه احتمال داده مي شود ربط بيشتري دارند در ابتداي فهرست نتايج ظاهر مي شوند. به عبارت ساده تر، پس از آن كه ماشين جستجوگر با استفاده از عبارات وارد شده، سايت هايي را از بانك اطلاعات خود بازيابي نمود،‌ اين سايت ها را بر اساس یك الگوريتم خاص –كه مربوط بودن آن سايت را به عبارت كاربر تخمين مي زند- مرتب كرده و در قالب فهرست نتايج به كاربر باز مي گرداند. اما بايد توجه كرد كه رويه ها و عواملي كه اين رتبه بندي را تعيين مي كنند معمولا جزو اسرار شركت ها هستند و در نتيجه معمولا مشكل مي توان فهميد كه دقيقا چرا يك سايت در فهرست نتايج برتر ظاهر مي شود.

 

پيش بيني ربط

عواملي كه براي پيش بيني مربوط بودن يك سايت با عبارت جستجوي كاربر استفاده مي شود را مي توان به طور كلي به دو قسمت تقسيم كرد: عوامل دروني (يعني عواملي كه مربوط به صفحه وب مي شوند) و عوامل بيروني (يا عواملي كه خارج از صفحه وب هستند)

عوامل دروني

فراواني كلمات در سند موجود؛ يعني فهرستي از تمام كلماتي كه در سند به كار رفته اند و ميزان فراواني هر كلمه در سند.
محل كلمات مورد جستجو در سند؛‌ يعني اينكه كلمات كليدي و تعريف كننده در عنوان (title)، سرتيتر (heading)، پاورقي (footer) و … آمده اند يا خير.
خوشه بندي رابطه اي (Relation Clustering)؛ يعني اينكه چند صفحه از اين سايت حاوي كلمات مورد جستجو هستند.
طرح HTML سند؛‌ چگونگي فريم ها و لينك ها، سرعت انتقال، Metatags و ALT.

عوامل بيروني

هر ماشين جستجوگر از الگوريتم خاص خود با انديس بندي و امتياز دادن به صفحات وب استفاده مي كند و سعي مي كند كه با بهبود بخشيدن به اين فرمول، به جستجوگران، مربوط ترين نتايج را بازگرداند. در اين راستا عوامل مطرح شده ارزيابي مي شوند و با يكديگر تركيب مي شوند تا بهترين فرمول براي بازيافت بهترين نتايج پيدا شود. كساني كه تمايل دارند وب سايت آنها در زمره 20 سايت اولي كه يك ماشين بر ميگرداند باشد بايد با دقت اين عوامل را بررسي نمايند.

محبوبيت لينكي: هر چه لينك هاي بيشتري به يك سايت نشانه رفته باشند بدين معني است كه محبوبيت آن سايت بيشتر و در نتيجه رتبه آن بالاتر است.
محبوبيت كليكي: سايت هايي كه به لحاظ تعداد دفعات و مدت زمان بيشتر مورد بازديد عموم قرار گرفته باشند از محبوبيت بيشتر و در نتيجه رتبه بالاتري برخوردار هستند.
محبوبيت گروهي: با ردگيري مسيرهاي كليك قشرهاي خاص جامعه مشخص مي شود كه كدام گروه ها بيشتر از اين سايت بازديد مي كنند و در نتيجه رتبه سايت براي گروه هاي مورد جستجو كننده مختلف، متفاوت است.
پيوندهاي بازرگاني ميان شركتهاي خدماتي: يعني سايتهايي كه مربوط به شركاي بازرگاني و يا خدمات خاصي باشند رتبه هاي بالاتري دارند.
امكان كسب جايگاه در ازاي پول: بعضي ماشين هاي جستجوگر مي پذيرند كه در ازاي دريافت وجهي مشخص، سايت را در مرتبه بالاتري قرار دهند.
اسم URL: برخي ماشين هاي جستجوگر سايتي را كه URL آن حاوي كلمات كليدي مورد جستجو باشد را رتبه بالاتري مي دهند.

 

 

 

محتويات ماشين جستجوگر

محتويات يك ماشين جستجوگر در واقع همان بانك اطلاعات آن است. اما اين بانك اطلاعات چگونه تشكيل مي شود؟ ماشين هاي مختلف از روشها و تكنولوژيهاي مختلفي استفاده مي كنند و اين باعث مي شود كه اگر يك عبارت جستجو را در دو ماشين مختلف وارد كنيم با دو نتيجه متفاوت رو به رو بشويم. اين مساله ناشي از تفاوت در برنامه ريزي نرم افزارهايي است كه ماشين هاي جستجوگر براي گزينش و بازيابي اطلاعات از آنها استفاده مي كنند.

اما به طور كلي همه ماشين هاي جستجوگر از سه قسمت مجزا تشكيل شده اند:

قسمت اول «عنكبوت» (spider) نام دارد. عنكبوت نرم افزاري است كه يك صفحه وب را ملاقات مي كند، آن را مي خواند و لينك هاي به صفحات ديگر را دنبال مي كند. به اين كار اصطلاحا كاوش مي گويند. عنكبوت به طور منظم، مثلا هر ماه يا دو ماه يكبار مجددا به سايتها و فضاي وب سر مي زند. به عنكبوتها، كاوشگر و روبات نيز مي گويند. اين روبات ها مثل تمام بازديدكنندگان ديگر در «كارنامه دسترسي» سايت ثبت مي شوند (بدين معني كه روبات از آن سايت ديدن كرده است). بر طبق همين كارنامه است كه مي توان متوجه شد يك ماشين جستجوگر از سايت بازديد كرده است يا خير.

البته بايد توجه كرد كه عنكبوتها نيز اسامي خاص خودشان را دارند و در اينجا، فهرست كوتاهي از اسامي عنكبوتهاي معروف ترين ماشين ها ذكر گرديده است. با مشاهده اين اسامي در كارنامه دسترسي وب سايت، مي توان فهميد كه آيا ماشين جستجوگر، آن وب سايت را تا به حال بازديد كرده است يا خير.

AltaVista                       Scooter

HotBot                           Slurp

Netscape                        Mozilla

InfoSeek                         Infoseek Sidewinder /0.9

WebCrawler                            Robot libwww /5.0

در سايت Market ware ابزاري عرضه شده كه براي تحليل كارنامه دسترسي و گرفتن اطلاعاتي كامل تر در مورد بازديد عنكبوتها از يك محل، قابل استفاده است. با اين ابزار حتي مي توان فهميد كه جويندگان از كدام كلمات كليدي براي جستجوهاي خود استفاده مي كنند.

هر چند كه از نظر طراحان و صاحبان وب سايت، عنكبوت مهم ترين قسمت ماشين جستجو گر است، اما هر ماشين دو قسمت اصلي ديگر نيز دارد:

تمام اطلاعاتي كه عنكبوت مي يابد وارد قسمت دوم ماشين جستجوگر، يعني انديس (index)   مي شود. انديس يا كاتالوگ مثل كتاب بزرگي است كه صفحات آن كپي همان صفحه- وب هايي است كه عنكبوت بازديد كرده. اگر صفحه وبي عوض شود، اين كتاب نيز تغيير مي كند.

بعضي وقتها بين زمان يافت شدن يك صفحه توسط عنكبوت و اضافه شدن آن به انديس، فاصله اي مي افتد. به عبارت ديگر، ممكن است عنكبوت از يك صفحه بازديد كرده باشد، اما هنوز آن صفحه به انديس وارد نشده باشد. تا زماني كه صفحه به انديس نرفته باشد، مورد جستجو و بازيابي قرار نخواهد گرفت.

سومين قسمت ماشين، نرم افزار جستجوگر آن است. اين برنامه قادر است ميليونها صفحه اي كه در انديس وجود دارد را گشته و موارد هماهنگ با كلمات جستجو را بيابد و آنها را بر اساس موارد هماهنگ با كلمات جستجو را بيابد و آنها را بر اساس الگوريتم خاص خود، رتبه بندي نمايد.

وجوه تمايز ماشين هاي جستجوگر

دو عامل مهمي كه كيفيت يك ماشين را تعيين مي كنند، «وسعت» و «عمق» جستجو هستند:

وسعت: منظور از وسعت، محدوده جغرافيايي اينترنت است كه مورد جستجو قرار مي گيرد. به طور كلي سه رده جغرافيايي براي جستجو وجود دارد : 1- سرورهايي كه در كشور مبدا ماشين جستجوگر وجود دارند. 2-سرورهايي از تمام قاره 3-سرورهايي از تمام دنيا

عمق: منظور از عمق ماشين اين است كه چه مقدار از سايت بازيابي شده در اختيار كاربر قرار مي گيرد. اين موضوع مي تواند چند سطح به ترتيب زير از حداقل تا حداكثر را در بر بگيرد:

فقط URL (http://…)
عنوان (title)
سر تيتر اول
اولين 200 كلمه ابتدايي
متن كامل سند
متن كامل به همراه برخي از لينك هاي اتصالي آن
متن كامل به همراه تمام لينك هاي اتصالي آن

جستجو بر اساس موقعيت كلمه در سند

 

30,000 ریال – خرید

تمام مقالات و پایان نامه و پروژه ها به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد.

 جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید. 

 

 

مطالب پیشنهادی: برای ثبت نظر خود کلیک کنید ...

براي قرار دادن بنر خود در اين مکان کليک کنيد
به راهنمایی نیاز دارید؟ کلیک کنید


جستجو پیشرفته مقالات و پروژه

سبد خرید

  • سبد خریدتان خالی است.

دسته ها

آخرین بروز رسانی