خلاصه:

تحقيقات اخير امكانپذيري استفاده از روشهاي يادگيري ماشين را كشف كرده‌اند كه اين امر در جهت فراهم آوردن طبقه‌بندي ترافيك شبكه دقيق مي‌باشد. ما پيش از اين اعتقاد داشتيم كه اين روشها مي‌تواند در ترافيك اينترنت بلادرنگ با صحت كافي براي كاربردهاي عملي كار كنند.  ما در اين مقاله با دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ [1]، يك چهارچوب براي طبقه‌بندي آماري سيستم بلادرنگ مشابه فراهم آورده‌ايم. اينكه به طور ضروري باعث تقسيم جريان شبكه، جمع‌آوري ويژگي‌هاي آماري اين جريانات مي‌شود و سپس اجازه‌ي طبقه‌بندي اين روند را در طبقه‌هاي ترافيك دوتايي با استفاده از  مدل پيش از توالي نايو بيز[2]  را مي‌دهد. دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ حاوي يك جمع‌كننده ساخته شده براي ورودي طبقه‌بندي نايو بيز مي‌باشد و بيشتر يك چهارچوب پيمانه‌ايي براي تسهيل تحقيقات در متدولوژي طبقه‌بندي آماري فراهم كرده است. اين همچنين باعث فراهم آوردن يك مجموعه جريان پارامترهاي ساده مي‌شود كه مي‌تواند وفق داده شود، بنابراين  اين باعث توانا كردن اثبات اثرات صمت طبقه‌بندي از محدوديت‌هاي سايز ساده  روند مي‌شود. نتايج نشان مي‌دهد كه دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ با استفاده از مدل نايو بيز مي‌تواند در نزديك سيستم بلادرنگ  بدون كاهش آشكار در دقت كار كند.

1- مقدمه:

طبقه‌بندي ترافيك بلادرنگ چهارچوب و مبناي مهمي براي عملكرد شبكه، مديريت و تحقيق مي‌باشد. اين امر به عنوان ورودي براي سيستم‌هاي رديابي تجاوز( وارد شدن به حريم خصوصي) به كار مي‌رود، كه باعث فراهم آوردن نقشه‌كشي گروه خدمات[3] [1] براي كنترل كيفيت خدمات و همچنين فراهم آوردن آمارهايي براي كنترل و مراقبت شبكه مي‌شود به طور جاري در اينترنت انواع متفاوتي از كاربردهاي شبكه  وجود دارد كه هر كدام داراي ويژگي‌هاي آماري متفاوت و نيازمنديهاي كنترل كيفيت خدمات مختلف مي‌باشند. بر مبناي اين گوناگوني، روشهاي طبقه‌بندي آماري مثل نايو بيز و تخمين زننده‌ي هسته سيستم عامل[4](كرنل) براي طبقه‌بندي ترافيك شبكه فراهم شده و به كار مي‌روند.[2] مقدار اندك 10 ويژگي‌ از جريان ترافيك جمع شده است بالاي 96% از دقت براي طبقه‌بندي ترافيك در 10 طبقه كاربردي متفاوت بدست آمده‌اند.

اين به طور اساسي رويكردهايي از طبقه‌بندي ترافيك سنتي متفاوت است، به طوري كه طبقه‌بندي آماري نمي‌تواند  تكيه بر اعداد پورت خاص و امضاء پروتكل داشته باشد بلكه تأكيد بر عملكرد آماري روند ترافيك مثل ميانگين سايز قطعه،  تفاوت سايز بار مفيد و سايز پنجره ي ابتدايي دارد، بنابراين از بررسي بار مفيد ترافيك جلوگيري كنيد چرا كه ممكن است باعث نگراني‌هاي پنهاني شود و مي‌تواند به شكل غير مؤثر استرداد شود و اين امر بواسطه‌ي به رمز درآوري بار مفيد پاكت‌ مي‌باشد. طبقه‌بندي آماري نتايج طبقه‌بندي دقيقي را نشان مي‌دهد و همچنين پيش‌بيني‌هاي اميدوار كننده‌‌اي را در طبقه‌بندي سيستم‌هاي ترافيك بلادرنگ فراهم مي‌كند كه يا به طور مستقل و يا در تركيب با روش‌شناسي‌هاي ديگر كار مي‌كنند. در اين مقاله، دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ ، يك چهار چوب طبقه‌بندي ترافيك آنلاين را فراهم كرده‌ايم كه قصد اثبات سهوت عملكرد طبقه‌بندي ترافيك آماري به شكل سيستم بلادرنگ را دارد كه بيشتر يك ورودي به سمت طبقه‌بندي سيستم بلادرنگ دقيق مي‌باشد. دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ محتوي يك انجام عمليات نمونه‌اوليه متدولوژي نايو بيز بالا مي‌باشد كه از مجموعه يكسال 10 ويژگي‌ روند استفاده مي‌كند كه توسط آن انتخاب مي‌شود[3] و همچنين باعث فراهم آوردن يك چهارچوب مي‌شود كه آن باعث آسان كردن بيشتر متدولوژي طبقه‌بندي متناوب با استفاده از ويژگي‌هاي متفاوت و الگوريتم اخيرالذكر مي‌شود. نتايج آزمايشي نشان مي‌دهد كه روشهاي طبقه‌بندي ترافيك آماري مي‌تواند دقت بالايي را فراهم كند كه اين امر با محاسبات قابل قبول و حافظه بالا مي‌باشد.

در اين اثنا، ما اعتقاد داريم اين نمونه اوليه‌ي دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ مي‌تواند بيشتر در يك چهارچوب طبقه‌بندي ترافيك آماري، زمان حقيقي صحيح‌تر براي شبكه‌هاي با سرعت بالاتر توسط يابد. ساختار اين مقاله بدين شكل دنبال مي‌شود. بخش بعد مروري بر كارهاي مربوط دارد. بخش 3 يك طرح معماري دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ را ارائه‌ مي‌دهد. بخش4 در مورد روش شناسي طبقه‌بندي براي سيستم بلادرنگ بحث مي‌كند. بخش 5 يك نتيجه‌ي آزمايشي را ارائه مي‌دهد و همچنين به تحليل آن مي‌پردازد. بخش 6 جمع‌بندي مقاله و ذكر كارهاي آينده را در بردارد.

 

 

 

 

 

2. كار مربوطه

وجود سيستم‌هاي طبقه‌بندي ترافيك زمان حقيقي در كاربرد (درخواست)، سيستم‌هاي كشف تجاوز (آي دي اس)[5] هستند مثل اسنرت و بي آر اُ اين [4] درخواست‌ها به طور اساسي از پروتكل اينترنت[6] و اطلاعات پورت در سه پيام پروتكل كنترل انتقال[7] / پروتكل برنامه كاربر [8]استفاده مي‌كند و در بار مفيد پاكت براي تشخيص ترافيك يك درخواست تشخيص داده مي‌شود. اتصال رشته‌هاي امضاء در بار مضر پاكت مي‌تواند خيلي پيچيده باشد و همين طور پر زحمت . بنابراين راه حل‌هاي بيشتر سيستم كشف تجاوز  به تكنولوژي سخت افزار مورد استفاده مثل فيلد كيت آرايه‌اي قابل برنامه‌ريزي  چرخش مي‌خورد، كه اين امر اجازه‌ي تشخيص ترافيك در شبكه‌هاي با سرعت بالا را مي‌دهد[5]. به هر حال يك محدوديت ضروري براي مكانيزم‌هاي سنتي آن است كه آنها متكي بر جستجوي "سمبل‌هاي " واضح (مثل اطلاعات پروتكل، عدد پورت يا امضاء) درخواست‌هاي متفاوت هستند، اما در كاربردهاي عملي نمي‌توانند نقشه‌كشي يك به يك براي اين چنين سمبول‌هايي داشته باشند يا حتي ممكن است اين چنين سمبل‌هايي را نداشته باشند. به عنوان مثال چندين كاربرد جاري با استفاده از پورت 80 وجود دارد و اين براي رفتن به (ديوار آتش)[9] مي‌باشد. به طور جالب‌تر، پروتكل پستي [10] و پروتكل انتقال ساده پستي[11] براي دستيابي دور دست و تسهيم فايل مورد استفاده قرار مي‌گيرد.[6] در كنار آن، افزايش استفاده از رمزدار كردن بارم مفيد پاكت براي اتصال امضاء پر زحمت مي‌باشد. علاوه بر‌آن،‌ دانش قبلي درخواست،‌ (مثل عدد پورت و امضاء مورد استفاده )  هميشه مورد نياز است و اين سيستم‌ها مي‌توانند به طور كارآمدي يك درخواست را تشخيص دهند. حجم‌‌هاي پيچيده‌تر مبني بر متدولوژي طبقه‌بندي ترافيك فراهم شده است[7] به طوري  كه حاوي 9 بلوك تابعي است و مي‌تواند به 100% دقت با كل 9 بلوك در عمل نزديك شود. محدوديت‌هاي عمده اين چنين سيستمي احتمالاً شامل سيستم توان عملياتي است و امكان اجرا در زمان حقيقي را ندارد. روشن و خاموش شدن BLINC [8] رويكرد ديگري مبني بر تشخيص الگوي عملكرد ميزبان براي طبقه‌بندي روند ترافيك مي‌باشد. اين براي متدولوژي مورد استفاده در اِي اِن تي سي  قائم مي‌باشد، به طوري كه مبني بر عملكرد روند ترافيك مي‌باشد. در كارهاي بعدي، همچنين اميدوار به تركيب اين روش با ‍ اِي اِن تي سي هستيم كه بوسيله‌ي تفسير اطلاعات عملكرد ميزبان مي‌باشد و مي‌تواند توسط اِي اِن تي سي مورد استفاده قرار گيرد يك بررسي تجربي مقدماتي در الگوريتم‌هاي يادگيري ماشين متفاوت فراهم آمده است.[9] اين تمركز بر مقايسه‌ي دقت و انجام عمليات الگوريتم‌ها دارد،  و به عنوان يك راهنماي خوب ورودي براي فراهم آوردن تكنيك‌هاي ماشين متفاوت در طبقه‌بندي ترافيك شبكه به كار گرفته مي‌شود. به هر حال نويسندگان ممكن است پيچيدگي اين مشكل را ناچيز بپندارند. براي طبقه‌بندي ترافيك آماري زمان حقيقي[10]، پيشنهاد مي‌شود روند مورد نظر بازي درون خطي [12]با يك پنجره اسلايد كوچك را مبني بر يك مدل مورد آزمايش در روندهاي فرعي كوتاه طبقه بندي كنيد.

شماري از اين آزمايشات در تشخيص بازي درون خطي يا وجود دارند، كه هر كدام يك نوع خاص درخواست مي‌باشند. قطع نظر از نتايج آزمايشي تحقيقات بيشتر براي اعتبار دادن به اين متدولوژي لازم خواهد بود.

 

3. معماري(ساختار):

يك چهارچوب طبقه‌بندي ترافيك شبكه زمان حقيقي مبني بر عملكرد روند به طور نظري شامل اين شيوه‌هاي زير مي‌باشند:

ü      تصرف پاكت:‌ براي تصرف پاكت از يك واسط شبكه

ü تقسيم روند: براي جمع‌آوري و پاكت‌هاي جمع‌آوري شده در هر روند در يك موضوع روند منفرد

ü جمع‌آوري ويژگي: براي جمع‌آوري جريان يا روند مورد نياز براي طبقه‌بندي از موضوع روند منفرد

ü طبقه‌بندي : براي بررسي اين ويژگي‌هاي روند با يك مدل از قبل آزمايش شده، به منظور پيش‌بيني طبقه‌ي درخواستي روند متعلق به آن.

اين روشهاي بالا از يك رد كامل روند داده و طرح اِي اِن تي سي به طور طبيعي براي يك ساختار لايه‌ايي شده و تركيب با چهار لايه‌ي يكسان دنبال مي‌شوند:



  

مدل لايه‌اي از دسترسي به طبقه‌بندي ترافيك شبكه بلادرنگ

تصرف پاكت و تقسيم جريان (روند) لايه‌هاي انتهايي سيستم هستند كه باعث تقسيم ترافيك اصلي در يك سري موضوعات روند منفرد طبقه‌بندي شده است و اين مستقل از روشهاي طبقه‌بندي است. يك واحد تصرف پاكت شامل از كتابخانه  ليپ كپ[13] استفاده مي‌كند، بنابراين هر دو ترافيك شبكه جاري و فايل ردگيري ترافيك(نسخه‌برداريDump)[14] را پشتيباني مي‌كند. در لايه تقسيم روند، به طورجاري  اِي اِن تي سي تنها پاكت‌هاي هر روند پروتكل كنترل انتقال را جمع‌آوري مي‌كند ديگر پاكت‌ها مثل پروتكل برنامه كاربر و پروتكل كنترل پيام در اينترنت[15]  از اين نمونه‌ اوليه‌ي صرف نظر مي‌كنند. همچنان كه  اين روندهاي، پروتكل كنترل انتقال در جايي روند شروع ايِ اِن تي سي نديده است. ايِ اِن تي سي در شروع روند براي دو دليل تمركز يافته است: ابتدا، به طور قابل مقايسه‌ايي براي نگه داشتن رد حالت اتصال آسان مي‌باشد،[12]  كه اين بوسيله‌ي ِخواندن از شروع جريان (روند) مي‌باشد. دوم،  شروع روند كه حاوي چندين ويژگي روند مؤثر مي‌باشد مثل سايز پنجره مقدماتي، از طرفي ديگر لايه ممكن است در كل نياز به روشهاي تقسيم جريان كاملاً متفاوت داشته باشد، بنابراين براي سادگي ما موقتاً تنها پروتكل كنترل انتقال را پشتيباني مي‌كنيم كه اكثريت ترافيك اينترنت را بوجود آورده است. [13] براي راه‌ ‌اندازي در نزديك به زمان حقيقي، بايد هميشه ايِ اِن تي سي نتايج طبقه‌بندي يك روند را  برگرداند به محض اينكه تعداد اندكي از پاكت‌ها در اين روند رسيدند. اين بدان معناست كه ممكن است تمام روندهاي پروتكل كنترل انتقال را به طور كامل جمع‌ كنند اما يك شمار كوچكي از پاكت‌ها را در عوض دارا مي‌باشد. به هر حال به چه تعداد پاكت با دقت كافي مي‌توان دست يافت و اين سوال حل نشده‌اي براي محققين است. بنابراين ايِ اِن تي سي به كاربر اجازه‌ي تشخيص شمار‌ ماكزيمم پاكت‌هاي نمونه‌ي روند را مي‌دهد،  و همچنين روند حداكثر ديگر پارامتر طول به عنوان يك تناوب براي تشكيل دهنده مي‌باشد.

در رأس لايه تقسيم، تجمع‌ ويژگي و لايه‌هاي طبقه‌بندي وجود دارند، كه هر دو مربوط به انتخاب روش طبقه‌بندي مي‌باشند به طور جاري ايِ اِن تي سي از چهارچوب (وكا)[16] [14] استفاده مي‌كند به طوري كه  دامنه ي وسيعي از الگوريتم‌هاي طبقه‌بندي را تحت پوشش قرار مي‌دهد و شامل روش نايو بيز كه ما استفاده مي‌كنيم مي‌باشد و اين به خاطر توانا كردن جايگزيني دستي و توجيه متدولوژي طبقه‌بندي مي‌شود. در لايه‌هاي جمع‌آوري ويژگي‌ ده ويژگي جمع‌آوري شدند سپس در فرمت داده وكا ذخيره شدند كه به عنوان ورودي طبقه‌بندي مي‌باشند. در نهايت در لايه طبقه‌بندي ايِ اِن تي سي ، وكا[17]  را براي   طبقه‌بندي روند احضار مي‌كنند  كه اين امر مبني بر مدل كرنل نايوبيز از پيش آزمايش شده مي‌باشد كه باعث فراهم آوردن نتايج خروجي مي‌شود. ما همچنين در مورد متدولوژي نايوبيز كه در بخش‌ بعد از آن استفاده مي‌كنيم بيشتر بحث خواهيم كرد. از طرفي ديگر ايِ اِن تي سي همچنين يك الگو براي جمع‌آوري ويژگي‌هاي روند ديگر فراهم آورده است بنابراين  پس از اين  براي سادگي انجام عمليات روش‌ شناسي طبقه‌بندي از ويژگي‌هاي متفاوت والگوريتم‌هاي گوناگوني استفاده مي‌كنيم. برخي از اين واحدها مي‌تواند در كنار هم تركيب شوند به عنوان مثال جمع‌آوري ويژگي‌ نمي‌تواند به حد لازم بعد از انتهاي تقسيم روند شروع شود. به هر حال آنان را به دو واحد متفاوت نگهداري شده پيمانه‌ايي با هزينه‌‌ي افزونگي محاسبه تقسيم كنيد. سودمندي پيمانه‌ايي دو دسته است:‌

اول اينكه اجازه مي‌دهد تا اپراتور شبكه به راحتي اين نرم‌افزار را به درخواست مونيتورينگ[18] شبكه‌شان اضافه كند و همچنين به ديگر محققين به راحتي اجازه‌ي كاربرد روش‌شناسي‌هاي متفاوت يا واحدهاي تصرف پاكت‌‌گرا مي‌دهد. اگر چه انجام عمليات روش نايوبيز با تخمين‌زن كرنل[2] اخيراً ساخته شده است، و اين تنها يك نقطه‌اي‌ شروع است و ما آنها را تشخيص داديم كه اين مي‌تواند چندين رويكرد متفاوت باشد. ما مي‌توانيم از ايِ اِن تي سي براي سهولت تحقيقات استفاده كنيم. واحدهاي بالا از ايِ اِن تي سي در سي انجام مي‌شوند در حالي كه وكا مبني بر جاوا مي‌باشد. بنابراين ميانجي كمكي محلي براي جاوا[19] [15] براي احضار وكا از سي مورد استفاده قرار مي‌گيرد.

 

4. روش‌شناسي طبقه‌بندي براي سيستم بلادرنگ

انجام عمليات بلادرنگ زمان حقيقي متدولوژي طبقه‌بندي نياز به تغير و تبديل و تنظيم در چندين جنبه دارد. طبقه‌بندي ترافيك زمان حقيقي كمك به فراهم كردن ورودي براي سيستمهاي  تشخيص نفوذ خدمات مي‌كند كه نياز به تشخيص و تعيين ابتدايي يك روند ترافيك دارد. اين اشاره به آن دارد كه طبقه‌بندي بايد با اطلاعات محدودي از تعداد هر چه كمتر پاكت متفاوت از كل روند به اتمام برسد. كاهش /تعداد/ پاكت‌ها در نمونه‌هاي روند ممكن است باعث كاهش محاسبه در جمع‌آوري ويژگي‌ها شود كه در شكل 2 آن را نشان داديم. مجموعاً كاهش تعداد ويژگي‌هاي جمع شده باعث كاهش محاسبه و حافظه در ويژگي‌هاي جمع‌آوري شده در طبقه‌بندي مي‌شود. به هر حال در مقايسه‌ي ايده‌آل اطلاعات بيشتر در يك روند نياز به فراهم آوردن دقت بيشتر داريم.

براي حل اين تناقض، براي سيستم طبقه‌بندي تحت سرپرستي مثل مال ما، چالش يافتن يك مدل طبقه‌بندي دقيق براي روندهاي بخش با شمار محدود پاكت‌ها مي‌باشد.  مشكل سه بعدي‌ است:‌ 1) مدل بايد در يك ويژگي دقيق با محاسبات محدود تعلم يابد و حافظه بايد آورده [20]باشد اما حاوي مقدار زيادي اطلاعات در جهت تصحيح نمونه‌هاي داده (روندهاي شبكه[21]) طبقه‌بندي شده باشد كه در طبقات كاربري هستند 2) براي تصحيح مدل، بايد اطلاعات كافي فراهم شود ، از يك شمار كافي نمونه‌هاي با داده صحيح در هر طبقه درخواست استفاده كنيد كه به شكل غيرانحرافي نگه داشته شده‌اند. 3) خود مدل بايد داراي حداقل پيچيدگي محاسباتي ممكن باشد.

مدل جاري ما مبني بر مدل نايو بيز[2] قبلي مي‌باشد.اِي اِن تي سي ده ويژگي ليست شده در جدول در پايين را براي طبقه‌بندي شبكه در 10 طبقه دلخواهي جمع‌آوري كرده است. ويژگي‌هايي كه ما استفاده كرديم براي آنها كه انتخاب كرده‌ايم با [2] مساوي مي‌باشد، و مؤثر بودن آنها را در روند كلي طبقه بندي به اثبات رسيده است. تنها تفاوت در انجام عمليات آن است كه ما ويژگي‌ها را از شمار محدودي از پاكت‌ها جمع‌آوري كرده‌ايم كه اين در آغاز روند بيشتر از نمونه‌هاي روند كلي بود. شكل 2 رابطه‌ي بين شمار محدود پاكت‌هاي متفاوت و محاسبه‌ي اين ويژگي‌ را نشان مي‌دهد. به طوري كه  تقريباً خطي مي‌باشد.

چون ما روي آغاز روندها تمركز كرده‌ايم، ما مدل خود را با استفاده از آغاز روندهاي محدود شده توسط شمار حداكثر پاكت‌هاي يكسان،‌توليد كرديم همانطور كه آنها را در طبقه‌بندي مورد استفاده قرار داده‌ بوديم اين يك راه حل طبيعي مبني بر نقش ساده اطلاعات آموزشي و آزمايش اطلاعات است كه بايد هميشه با يكديگر اتصال داشته باشد.

پیچیدگی

حافظه سرجمع

زمان جمع آوری

نام

O(1)

O(1)

مدت گرفتن

قرار دادن- بسته های- خدمتگزار

O(1)

O(1)

مدت گرفتن

نخستین- پنجره- بایت ها - خدمتگزار

O(1)

O(1)

مدت گرفتن

نخستین پنجره بایتها مشتری

O(1)

O(1)

مدت گرفتن و قبل از اتمام

متوسط قطعه اندازه- خدمتگزار

O(n)

O(1)

قبل از اتمام

Ip داده بایت میانگین مشتری

O(n)

O(n)

مدت گرفتن

واقعی   داده - بسته ها- مشتری

O(n)

O(n)

قبل از اتمام

داده بایتها واریانس خدمتگزار قبل از اتمام

O(n)

O(1)

مدت گرفتن

کمترین قطعه اندازه مشتری

O(n)

O(1)

مدت گرفتن

Rtt نمونه ها مشتری

O(n)

O(1)

مدت گرفتن

قرار دادن بسته ها - مشتری

جدول 1 : لیستی از ترکیبات مورد استفاده در نايو بيز  که طبقه بندی جزئیات خام از این ترکیبات قابل دسترس می‌باشد.

 

5. نتايج آزمايشي

پايگاه داده ما شامل دوروند وقفه از ترافيك اينترنت مي‌باشد.مرحله 2 هشت ماه بعد از مرحله 1 است. اين پايگاه داده با استفاده از يك جعبه مونيتورينگ با سرعت بالا جمع‌آوري [17] شده كه در اتصال اينترنت، شبكه، از فضاي باز ژنوم[22] نصب شده است.

فضاي باز  يك تحقيق ساده با حدود 1000 كارمند است كه به اينترنت از طريق يك پيوند اترنت گيگا بايت كاملاً  (دو رشته‌اي) اتصال دارند.هر پاكت در هر مسير پيوند با يك بار مفيد كامل تصرف مي‌شود. سپس پاكت‌ها توسط دست در ده طبقه درخواست طبقه‌بندي مي‌شوند، چون اساس كار براي آزمايشگري، يعني شبكه گسترده جهاني[23] ، پست الكترونيكي[24] و حمله[25]، همكار به همكار[26] ، پايگاه داده [27] ، چند رسانه‌اي[28]، خدمات انفعالي[29]، بازي‌ها[30] و تود مي‌باشند. محاسبه‌ي مرحله 1 و مرحله 2پايگاه داده در جدول 2 نشان داده شده است.


 

شكل 2 : ويژگي زمان جمع آوري  وي اس. روند اندازه نمونه.

 

اکثریت

بازی

INTR

SERV

MMED

DB

P2P

ATT

بسته پستی

WWW

مجموع

 

12309

5

86

1798

444

2794

1908

2548

28120

273867

323879

روز اول

10793

0

36

1112

4

2606

2762

987

16483

140868

175651

روز دوم

جدول شماره 2،مجموعه‌ داده‌های از دو تا از روزهای غیر متوالی با یک فاصله از ماههای هشتم

 

در آزمايش ما به بررسي 5 نمونه روند متفاوت با محدوده طولي پرداختيم يعني پاكت‌هاي 5،10،25،50،100 تايي. ابتدا، اعتبار سراسري طبقه‌طبقه را جمع‌آوري كرديم،[14] نتايج از وكا براي هر مجموعه، داده‌اي روزانه مقادير درست كلي مدل‌ها مبني بر اين نتايج محاسبه‌ شده‌اند همچنانكه دقت و به يادآوري مقادير براي سه تا از طبقات بزرگ درخواست انجام مي‌شود: شبكه گسترده جهاني، پست‌الكترونيكي ، توده.


با توجه به اين نتايج مي‌توان فهميد كل صحت براي مرحله 1 و مرحله2 با استفاده از محدوديت‌هاي پاكت‌ متفاوت مي‌باشد. با توجه به آن مقدار كم 5 پاكت صحت كلي هر مجموعه داده مي‌تواند به 90% برسد و با 25 پاكت مرحله 1 مي‌تواند به بالاي 93% دست يابد در حالي كه مرحله 2 به صحت 97% به طور شگفت‌آوري دست پيدا مي‌كند. براي مقايسه‌ي مطالعاتي، همچنين به بررسي كامل نمونه‌سازي روند با استفاده از متدولوژي نايوبيز كه  در مجموعه داده‌اي يكساني ساخته شده است پرداختيم اين نتايج در 5/96% و 8/95% صحت براي مرحله1  و مرحله 2 مي‌باشند.

بنابراين حتي ويژگي‌هايي كه ما براي  آغاز روند نمونه‌ها مورد استفاده قرار داده‌ايم يكسان است چون آنها براي نمونه‌هاي با روند كلي انتخاب شدند.[2] نتايج از اين ويژگي‌ها مي‌تواند به عنوان يك سطح يكسان از جهت مورد توجه قرار گيرد.


علاوه بر اين به خاطر معتبر كردن تبادل موقتي مدل، ما به بررسي اعتبار سراسري بين دو مجموعه داده‌اي پرداختيم. دقت ممكن است با زمان دچار زوال شود و اين بواسطه‌ي ظهور درخواست‌هاي جديد تغيير ترافيك اينترنت مي‌باشد. اگر چه برخي سطوح كاهشي در كل صحت مي‌تواند در نتايج ما ديده شوند. مدل هنوز قادر به فراهم آوردن اطلاعات سودمند در روند مي‌باشد. به عنوان مثال مقدار يا ارزش ترافيك شبكه گسترده جهاني مي‌تواند داراي برخي توسعه‌هاي قابل اطمينان باشد. در مقايسه، نمونه‌گيري روند كلي در 94% و 92% ديده شده است.


 6. نتيجه‌گيري و كارهاي آينده:

چندين عامل مهم در سيستم طبقه‌بندي ترافيك آن لاين وجود دارد مثل صحت،‌ تماميت، چالش‌ها در بهبود اجراي كلي همچنين در تعادل بين اين فاكتورها يك فاصله مشكل پيچيده را بوجود مي‌آورند. ما تصديق مي‌كنم كه نتايج ما و آزمايشاتمان در تحقيقات طبقه‌بندي زمان حقيقي ارائه شده در اين مقاله تلاش داشته كه به شكل ساده و غير مبهم موارد را بازگو كند . ما همچنين يادداشت كرديم كه مواردي از رويكردهاي آماري جاري وجود دارند.

به عنوان مثال تكنيك‌هاي قابل اعتماد و آماده بطور عملي به اطلاعاتي حداقل با پاكت‌هاي كم نياز دارد قبل از اينكه بتواند يك پيش‌بيني قابل اطمينان در يك روند ناشناخته انجام دهد. اين به معناي نهفتگي در طبقه‌بندي ترافيك آماري‌ مي‌باشد كه احتمالاً بالاتر از سه پيام سنتي و مكانيزم‌هاي مبني بر امضاء مي‌باشد راهي براي حل اين مشكل مي‌تواند دريچه‌هايي را براي كارها آينده باز كند، كه اين به طور عمده‌ايي بستگي به هدف سيستم طبقه‌بندي زمان حقيقي دارد. به هر حال يك طبقه‌بندي ترافيك پيچيده‌تر باعث تركيب مقاومت رويكردهاي متفاوت مي‌شود كه اين براي جواب دادن به اين مشكل اميدوار كننده خواهد بود. اين مي‌تواند يك چالش باشد اما نه يك محدوديت براي سيستم‌هاي طبقه‌بندي ترافيك كه در زمان حقيقي راه‌اندازي شده‌اند.

در اين مقايسه، ساختاري از اِي اِن تي سي را فراهم آورديم: يك سيستم چهارچوب طبقه‌بندي ترافيك آماري كه در يك شبه سيستم بلادرنگ طبق اِي اِن تي سي اجزاي سيستم متدولوژي طبقه‌بندي نايوبيز را مطرح كرديم با جمع‌آوري ويژگي‌ها در آغاز روندها نتايج آزمايشي ما نشان مي‌دهد اين  روش طبقه‌بندي مي‌تواند به سطح يكساني از صحت دست پيدا كند به طوري كه در طبقه‌بندي ترافيك برون خطي مورد استفاده قرار مي‌گيرد. اِي اِن تي سي يك چهارچوب ساده است اما به عنوان يك ابزار قدرتمند براي كشف كل فضاي مشكل شروع مي‌شود. اجازه وي مجموعه‌هاي با ويژگي‌هاي متفاوت را مي‌دهد. از طبقه‌كننده‌هاي متفاوتي استفاده مي‌كند و پارامترهاي نمونه‌سازي  روند را ميزان سازي‌ مي‌كند. اِي اِن تي مي‌تواند به راحتي باعث تسهيل تحقيقات بيشتر براي تشخيص مناسب‌ترين مجموعه ويژگي‌ها شود و مي‌تواند باعث تسهيل الگوريتم طبقه‌بندي زمان حقيقي شود علاوه به آن اِي اِن تي سي با محتويات ساخته شده در آينده‌ايي نزديك مجهز خواهد شد، بنابراين يك تحقيق  كامل براي طبقه‌بندي ترافيك ‌ در شبكه‌هاي با سرعت بالا در حال شكل‌گيري است.

 



1- Approaching Real – time Network Traffic classification (ANTC)

[2] - Naïve Bayes

3- Class- of- service(Cos)

4- Kernel

1- intrusion detection systems (IDS)

2- Internet Protocal(IP)

3- Trans mission control protocol(TCP)

4- User datagram protocd(UDP)

6- سيستم ايمني سخت‌افزار يا نرم‌افزار بين سرور يا انترنت و انترنت عمومي (مترجم)

7- Post office  protocol (version tree) (pop3)

 

8- Simple Mail transport protocol (SMTP)

2- On line game

1-    Libp/cap

 

-2Dump                                                    

-3  Internet control message protocol(ICMP)

 4- Weka

-1monitoring

[19] - oava Native Interface (JNI)

 

1-       Network  flows

1-Genome campus

2-World wide web (www)

3- Electronic Mail (EMALI)

4- ATTACK

5- Data Base

6- Multi  Media

7- INTERA ction Service

8- Games

9- Bulk