Seo বা সার্চ ইন্জিন অপটিমাইজেশন পর্ব 3

Posted on : December 22, 2017 | post in : Blogger,Seo full part,Seo Tips,Wapka |Leave a reply |

Seo বা সার্চ ইন্জিন অপটিমাইজেশন পর্ব 3

                                                                                          Seo বা সার্চ ইন্জিন অপটিমাইজেশন পর্ব 3

seo

                              part 2
“robots.txt” ফাইল এমন একটি ফাইল যেটা সার্চ ইন্জিনকে বলে যে,সার্চ ইন্জিন একটা সাইটের কোন কোন্ পেজ crawl করবে আর কোন কোন পেজ crawl করবেনা।এই robots.txt ফাইলটি রুট ফোল্ডারে থাকে।
আপনার সাইটের কিছু পেজ সার্চ রেজাল্টে না দেখানো হোক আপনি হয়ত এটা চাইতে পারেন।কারন হতে পারে সেই পেজগুলির কাজ এখনও শেষ হয়নি বা অন্য যেকোন কারন।এজন্য আপনি একটি robots.txt ফাইল তৈরী করে সেখানে ঠিক করে দিতে পারেবন যে কোন্ কোন্ পেজ সার্চ ইন্জিন crawl করবেনা।আপনার যদি সাবডোমেইন থাকে এবং এর কিছু পেজ যদি সার্চ রেজাল্টে না দেখানো হোক এটা চান তাহলে এটার জন্য আলাদা একটা robots.txt ফাইল তৈরী করতে হবে।robots.txt ফাইলটি তৈরীর পর রুট ফোল্ডারে আপলোড করতে হবে।

robots.txt ফাইল তৈরী

robots.txt ফাইল দিয়ে সার্চ ইন্জিনের বট,ক্রাউলার এবং স্পাইডার সাইটের কোন্ কোন্ পেজ দেখবে এবং কোন্ কোন্ পেজ দেখবেনা এসব নিয়ন্ত্রন করা যায়।এই নিয়ন্ত্রনের পদ্ধতিকে বলা হয় রোবটস এক্সক্লুসন প্রটোকল (Robots Exclusion Protocol) বা রোবটস এক্সক্লুসন স্টান্ডার্ড (Robots Exclusion Standard) .এই ফাইল তৈরীর আগে এখানে ব্যবহৃত কিছু চিহ্ন চিনে নেয়া যাক
Robots.txt Protocol – Standard Syntax & Semantics
অংশ/চিহ্ন বর্ননা
User-agent: নির্দেশ করে রোবট(সমূহ)কে
* Wildcard. User-agent: * এটার অর্থ সব রোবট
disallow: প্রতিটি লাইন disallow: দিয়ে শুরু হয়।এরপরে আপনি / দিয়ে URL path ঠিক করে দিতে পারেন।এতে করে ওই path বা ফাইল বা ওই পেজ আর রোবট ক্রাউল করবেনা।যদি কোন path না দেন অথ্যাৎ ফাকা থাকে তাহলে disallow  কাজ করবে allow এর।
# কমেন্ট করার জন্য।এটার পরে কোন লাইন এজন্য লেখা হয় যাতে এই লাইনটি পরে বোঝা যায় যে নিচের কোডগুলি কি বিষয়ক হবে।
Disallow ফিল্ড আংশিক বা পূর্নাঙ্গ URL উপস্থাপন করতে পারে।/ চিহ্নের পর যে path উল্লেখ থাকবে সেই path রোবট ভিজিট করবেনা।যেমন
Disallow: /help
#disallows both /help.html and /help/index.html, whereas
Disallow: /help/
# would disallow /help/index.html but allow /help.html
কিছু উদাহরন
সব রোবট অনুমোদন করবে করবে সব ফাইল ভিজিটের জন্য (wildcard “*” নির্দেশ করে সব রোবট)
User-agent: *
Disallow:
সব রোবট  কোন ফাইল ভিজিট করবেনা
User-agent: *
Disallow: /
গুগলবট এর শুধু ভিজিটের অনুমোদন থাকবে বাকি কেউ ভিজিট করতে পারবেনা
User-agent: GoogleBot
Disallow:
User-agent: *
Disallow: /
গুগলবট এবং ইয়াহুস্লার্প এর শুধু ভিজিটের অনুমোদন থাকবে বাকি কারো থাকবেনা
User-agent: GoogleBot
User-agent: Slurp
Disallow:
User-agent: *
Disallow: /
কোন একটা নির্দিষ্ট বটের ভিজিট যদি বন্ধ করতে চান তাহলে
User-agent: *
Disallow:
User-agent: Teoma
Disallow: /
এই ফাইলটি দ্বারা যদি আপনার সাইটের কোন URL বা পেজ crawl করা বন্ধ করে দেন তারপরেও কিছু সমস্যার কারনে এই পেজগুলি কোথাও কোথাও দেখাতে পারে।যেমন রেফারেল লগ এ URL গুলি দেখাতে পারে।তাছাড়া কিছু কিছু সার্চ ইন্জিন আছে যাদের এলগরিদম খুব উন্নত নয় ফলে এসব ইন্জিন থেকে যখন স্পাইডার/বোট crawl করার জন্য পাঠায় তখন এরা robots.txt ফাইলের নির্দেশনাকে উপেক্ষা করে আপনার সব URL crawl করে যাবে।
এসব সমস্যা এড়াতে আরেকটা ভাল পদ্ধতি হল এই সমস্ত কনটেন্টকে htaccess ফাইল দিয়ে পাসওয়ার্ড বা বন্ধ করে রাখা।

rel=”nofollow” এর ব্যাপারে সতর্ক থাকুন

কোন লিংকে rel এট্রিবিউট এ “nofollow” সেট করে দিয়ে গুগল বা সার্চ ইন্জিনকে বলে দিতে পারেন যে এই সমস্ত লিংক যেন সে crawl না করে।যদি আপনার সাইট কোন ব্লগ বা ফোরাম হয় যেখানে মন্তব্য করা যায় তাহলে কমেন্ট অংশকে এভাবে nofollow করে দিয়ে রাখতে পারেন।এতে করে আপনার ব্লগ বা ফোরামের খ্যাতি ব্যবহার করে নিজের সাইটের rank বাড়াতে পারবেনা।আবার অনেক সময় অনেকে আপত্তিকর সাইটের ঠিকানা আপনার সাইটে দিতে পারে ফলে যা আপনি চান না। এছাড়াও এমন সাইটের লিংক দিতে পারে যেটা গুগলের কাছে spammer, এতে করে আপনার সাইটের খ্যাতি নষ্ট হবে।
<a href=”http://www.shadyseo.com” rel=”nofollow”>Comment spammer</a>
প্রতিটি লিংকে nofollow না দিয়ে robot মেটা ট্যাগেও nofollow দিলে একই কাজ করবে।
<html>
<head>
<title>Brandon’s Baseball Cards – Buy Cards, Baseball News, Card Prices</title>
<meta content=”Brandon’s Baseball Cards provides a large selection of vintage and modern baseball cards for sale. We also offer daily baseball news and events in”>
<meta content=”nofollow”>
</head>
<body>
বিখ্যাত সব সার্চ ইন্জিনে আপনার সাইটের ইউআরএল (URL) সাবমিট করুন
গুগলে সাইটের URL সাবমিট করার জন্যhttp://www.google.com/addurl/ এখানে যান,নিচে দুটি বক্স আসবে URL বক্সে সাইটের URL এবং comments বক্সে সাইট সম্পর্কে সংক্ষিপ্ত বর্ননা দিয়ে Add URL বাটনে ক্লিক করলেই গুগল আপনার সাইট crawl করা শুরু করবে।
                    url submission
ইয়াহুতে URLhttp://www.addurlyahoo.com/siteekle.aspএখানে গিয়ে category,subcategory সিলেক্ট করে URL সাবমিট করুন।
বিং সার্চ ইন্জিনে সাইট সাবমিটের জন্যhttp://www.bing.com/webmaster/SubmitSitePage.aspxএ গিয়ে সাইটের ঠিকানা টাইপ করে সাবমিট বাটনে ক্লিক করুন।
ওয়েবমাস্টারদের গুগল ওয়েবমাস্টার টুল এর ব্যবহার জানা অনেকটা অপরিহার্য।এখানে যেকোন সাইট যোগ করে দিতে পারেন একদম বিনামুল্যে।গুগলে আপনার সাইটের পেজগুলি কিভাবে দেখাবে এ বিষয়ে গুগল ওয়েবমাস্টার টুল বিস্তারিত বর্ননা প্রদান করে,এছাড়াও আরও অনেক কাজ আছে নিচে বিস্তারিত দেয়া হল
প্রথমে এই ঠিকানায় যেতে হবে,এখানে গেলেই আপনার জিমেইল একাউন্ট দিয়ে সাইন ইন করতে বলবে।আপনার যদি জিমেইল একাউন্ট না থাকে তাহলে একটা খুলে নিন কারন জিমেইল একাউন্ট ছাড়া গুগল ওয়েবমাস্টার টুল এর এই সেবা (সম্পূর্ন বিনামুল্যের)গ্রহন করতে পারবেননা।আর যদি থাকে তাহলে এখানে ইউজার নাম এবং পাসওয়ার্ড দিয়ে সাইন ইন করে ভিতরে ঢুকুন।
এবার গুগল ওয়েবমাস্টার টুলে আপনি এক বা একাধিক সাইট যুক্ত করতে পারেন।এজন্য Add a Site নামের বাটনে ক্লিক করে আগত বক্সে আপনি যে সাইটটি যোগ করতে চান তার নাম দিয়ে Continue বাটনে ক্লিক করুন।
              webmaster tool-add a site

                                                                seo

এবার Verify ownership নামের একটি পেজ আসবে এখান থেকে গুগলকে বুঝাতে হবে যে ,সাইটটির প্রকৃত মালিক আপনি।সাইটের মালিকানা প্রমান করতে গুগল এখানে ৪টি পদ্ধতি অনমোদন করে,আপনি যেকোনটি ব্যবহার করে এটা প্রমান করতে পারেন।
এরমধ্যে ১ম পদ্ধতিটি খুব সহজ,Upload an HTML file to your server এই চেকবক্সটি চেক করে একটু নিচে স্ক্রল করে গিয়ে দেখুন একটা এইচটিএমএল ভেরিফিকেশন কোড এর ডাউনলোড লিংক আছে,ছোট এই ফাইলটি ডাউনলোড করে আপনার সাইটের রুট ফোল্ডারে আপলোড করুন।সিপ্যানেল যদি ব্যবহার করেন তাহলে আপনার public_html এ ফাইলটি আপলোড করুন।
এবার Verify ownership পেজে এসে http://www.iconictbd.com এই ধরনের একটা লিংক আছে এখানে ক্লিক করে ফাইলটি আপলোড নিশ্চিত করুন এবং শেষে verify বাটনে ক্লিক করে এই পর্ব শেষ করুন।
ভেরিফাই শেষ করলে এই ধরনের একটা পেজ আসবে,এখান থেকে আপনার সাইটটির লিংকের উপর ক্লিক করে ড্যাশবোর্ডে এ যান।
webmaster tool-dashboard

                                        seo

ড্যাশবোর্ডে বিভিন্ন ধরনের তথ্যের সারমর্ম থাকে যেমন Search queries এখানে আপনার সাইট খোজার জন্য গুগলে কোন কোন্ শব্দ ব্যবহার করা হয় এসব শব্দের তালিকা থাকে।
Crawl errors এখানে আপনার সাইট ক্রাউল করতে কোন সমস্যা হয়েছে কিনা এসব তথ্য থাকে।
Links to your site এখানে আপনার সাইটের লিংক আর কোন কোন সাইটে আছে এসব সাইটের তালিকা থাকে।
Keywords এখানে গুগলবট আপনার সাইট ক্রাউলিং এর সময় কোন শব্দগুলি বেশি পায় সেসব শব্দের তালিকা থাকে।
Sitemaps এখানে সাইটম্যাপ সাবমিট করেছেন কিনা বা করলে সাইটম্যাপের কতটি URL গুগলের ডেটাবেসে নেয়া হয়েছে ইত্যাদি তথ্য থাকে।
ড্যাশবোর্ডের বামদিকে Site Configuration মেনুর অধীনে প্রথম সাবমেনু sitemap.এখান থেকে গুগলে সাইটম্যাপ সাবমিট করতে হয়।এছাড়া এখানে সাইটম্যাপ সাবমিট করেছেন কিনা বা করলে সাইটম্যাপের কতটি URL গুগলের ডেটাবেসে নেয়া হয়েছে ইত্যাদি তথ্য থাকে।নতুন একটা সাইটম্যাপ সাবমিট করতে Submit a sitemap বাটনে ক্লিক করুন এতে একটি বক্স আসবে এখানে আপনার সাইটম্যাপটি যেখানে আছে তার ঠিকানা লিখে Submit Sitemap বাটনে ক্লিক করুন।উদাহরনস্বরুপ নিচের সাইটের কথা বিবেচনা করছি,এখানে আমি স্লাশ চিহ্নের পর sitemap.xml দিয়েছি কারন আমার সাইটের সাইটম্যাপটি রুট ফোল্ডারে আছে।
sitemap submission

                                               seo

আমি আগেই সাইটম্যাপ সাবমিট করেছি তাই উপরে দেখুন Sumitted URLs এ দেখাচ্ছে যে আমি ২০০ টি URL সাবমিট করেছিলাম এবং এখান থেকে গুগলের ডেটাবেসে ১৯৯ টি সেভ করা হয়েছে।seo

Tags: ,

Leave a Reply

 
Theme Designed Bybody{border:6px solid orange; margin:6px;}
Skip to toolbar