دسترسي به طبقهبندي ترافيك شبكه بلادرنگ
خلاصه:
تحقيقات اخير
امكانپذيري استفاده از روشهاي يادگيري ماشين را كشف كردهاند كه اين امر در جهت
فراهم آوردن طبقهبندي ترافيك شبكه دقيق ميباشد. ما پيش از اين اعتقاد داشتيم كه
اين روشها ميتواند در ترافيك اينترنت بلادرنگ با صحت كافي براي كاربردهاي عملي
كار كنند. ما در اين مقاله با دسترسي به طبقهبندي ترافيك
شبكه بلادرنگ [1]،
يك چهارچوب براي طبقهبندي آماري سيستم بلادرنگ مشابه فراهم آوردهايم. اينكه به
طور ضروري باعث تقسيم جريان شبكه، جمعآوري ويژگيهاي آماري اين جريانات ميشود و
سپس اجازهي طبقهبندي اين روند را در طبقههاي ترافيك دوتايي با استفاده از مدل پيش از توالي نايو بيز[2] را ميدهد. دسترسي به طبقهبندي ترافيك شبكه
بلادرنگ حاوي يك جمعكننده ساخته شده براي ورودي طبقهبندي نايو بيز ميباشد و
بيشتر يك چهارچوب پيمانهايي براي تسهيل تحقيقات در متدولوژي طبقهبندي آماري
فراهم كرده است. اين همچنين باعث فراهم آوردن يك مجموعه جريان پارامترهاي ساده ميشود
كه ميتواند وفق داده شود، بنابراين اين
باعث توانا كردن اثبات اثرات صمت طبقهبندي از محدوديتهاي سايز ساده روند ميشود. نتايج نشان ميدهد كه دسترسي به
طبقهبندي ترافيك شبكه بلادرنگ با استفاده از مدل نايو بيز ميتواند در نزديك سيستم
بلادرنگ بدون كاهش آشكار در دقت كار كند.
1- مقدمه:
طبقهبندي ترافيك بلادرنگ چهارچوب و مبناي مهمي براي عملكرد شبكه، مديريت و تحقيق ميباشد. اين امر به عنوان ورودي براي سيستمهاي رديابي تجاوز( وارد شدن به حريم خصوصي) به كار ميرود، كه باعث فراهم آوردن نقشهكشي گروه خدمات[3] [1] براي كنترل كيفيت خدمات و همچنين فراهم آوردن آمارهايي براي كنترل و مراقبت شبكه ميشود به طور جاري در اينترنت انواع متفاوتي از كاربردهاي شبكه وجود دارد كه هر كدام داراي ويژگيهاي آماري متفاوت و نيازمنديهاي كنترل كيفيت خدمات مختلف ميباشند. بر مبناي اين گوناگوني، روشهاي طبقهبندي آماري مثل نايو بيز و تخمين زنندهي هسته سيستم عامل[4](كرنل) براي طبقهبندي ترافيك شبكه فراهم شده و به كار ميروند.[2] مقدار اندك 10 ويژگي از جريان ترافيك جمع شده است بالاي 96% از دقت براي طبقهبندي ترافيك در 10 طبقه كاربردي متفاوت بدست آمدهاند.
اين به طور اساسي رويكردهايي از طبقهبندي ترافيك سنتي متفاوت است، به طوري كه طبقهبندي آماري نميتواند تكيه بر اعداد پورت خاص و امضاء پروتكل داشته باشد بلكه تأكيد بر عملكرد آماري روند ترافيك مثل ميانگين سايز قطعه، تفاوت سايز بار مفيد و سايز پنجره ي ابتدايي دارد، بنابراين از بررسي بار مفيد ترافيك جلوگيري كنيد چرا كه ممكن است باعث نگرانيهاي پنهاني شود و ميتواند به شكل غير مؤثر استرداد شود و اين امر بواسطهي به رمز درآوري بار مفيد پاكت ميباشد. طبقهبندي آماري نتايج طبقهبندي دقيقي را نشان ميدهد و همچنين پيشبينيهاي اميدوار كنندهاي را در طبقهبندي سيستمهاي ترافيك بلادرنگ فراهم ميكند كه يا به طور مستقل و يا در تركيب با روششناسيهاي ديگر كار ميكنند. در اين مقاله، دسترسي به طبقهبندي ترافيك شبكه بلادرنگ ، يك چهار چوب طبقهبندي ترافيك آنلاين را فراهم كردهايم كه قصد اثبات سهوت عملكرد طبقهبندي ترافيك آماري به شكل سيستم بلادرنگ را دارد كه بيشتر يك ورودي به سمت طبقهبندي سيستم بلادرنگ دقيق ميباشد. دسترسي به طبقهبندي ترافيك شبكه بلادرنگ محتوي يك انجام عمليات نمونهاوليه متدولوژي نايو بيز بالا ميباشد كه از مجموعه يكسال 10 ويژگي روند استفاده ميكند كه توسط آن انتخاب ميشود[3] و همچنين باعث فراهم آوردن يك چهارچوب ميشود كه آن باعث آسان كردن بيشتر متدولوژي طبقهبندي متناوب با استفاده از ويژگيهاي متفاوت و الگوريتم اخيرالذكر ميشود. نتايج آزمايشي نشان ميدهد كه روشهاي طبقهبندي ترافيك آماري ميتواند دقت بالايي را فراهم كند كه اين امر با محاسبات قابل قبول و حافظه بالا ميباشد.
در اين اثنا، ما اعتقاد داريم اين نمونه اوليهي دسترسي به طبقهبندي ترافيك شبكه بلادرنگ ميتواند بيشتر در يك چهارچوب طبقهبندي ترافيك آماري، زمان حقيقي صحيحتر براي شبكههاي با سرعت بالاتر توسط يابد. ساختار اين مقاله بدين شكل دنبال ميشود. بخش بعد مروري بر كارهاي مربوط دارد. بخش 3 يك طرح معماري دسترسي به طبقهبندي ترافيك شبكه بلادرنگ را ارائه ميدهد. بخش4 در مورد روش شناسي طبقهبندي براي سيستم بلادرنگ بحث ميكند. بخش 5 يك نتيجهي آزمايشي را ارائه ميدهد و همچنين به تحليل آن ميپردازد. بخش 6 جمعبندي مقاله و ذكر كارهاي آينده را در بردارد.
2. كار مربوطه
وجود سيستمهاي طبقهبندي ترافيك زمان حقيقي در كاربرد (درخواست)، سيستمهاي كشف تجاوز (آي دي اس)[5] هستند مثل اسنرت و بي آر اُ اين [4] درخواستها به طور اساسي از پروتكل اينترنت[6] و اطلاعات پورت در سه پيام پروتكل كنترل انتقال[7] / پروتكل برنامه كاربر [8]استفاده ميكند و در بار مفيد پاكت براي تشخيص ترافيك يك درخواست تشخيص داده ميشود. اتصال رشتههاي امضاء در بار مضر پاكت ميتواند خيلي پيچيده باشد و همين طور پر زحمت . بنابراين راه حلهاي بيشتر سيستم كشف تجاوز به تكنولوژي سخت افزار مورد استفاده مثل فيلد كيت آرايهاي قابل برنامهريزي چرخش ميخورد، كه اين امر اجازهي تشخيص ترافيك در شبكههاي با سرعت بالا را ميدهد[5]. به هر حال يك محدوديت ضروري براي مكانيزمهاي سنتي آن است كه آنها متكي بر جستجوي "سمبلهاي " واضح (مثل اطلاعات پروتكل، عدد پورت يا امضاء) درخواستهاي متفاوت هستند، اما در كاربردهاي عملي نميتوانند نقشهكشي يك به يك براي اين چنين سمبولهايي داشته باشند يا حتي ممكن است اين چنين سمبلهايي را نداشته باشند. به عنوان مثال چندين كاربرد جاري با استفاده از پورت 80 وجود دارد و اين براي رفتن به (ديوار آتش)[9] ميباشد. به طور جالبتر، پروتكل پستي [10] و پروتكل انتقال ساده پستي[11] براي دستيابي دور دست و تسهيم فايل مورد استفاده قرار ميگيرد.[6] در كنار آن، افزايش استفاده از رمزدار كردن بارم مفيد پاكت براي اتصال امضاء پر زحمت ميباشد. علاوه برآن، دانش قبلي درخواست، (مثل عدد پورت و امضاء مورد استفاده ) هميشه مورد نياز است و اين سيستمها ميتوانند به طور كارآمدي يك درخواست را تشخيص دهند. حجمهاي پيچيدهتر مبني بر متدولوژي طبقهبندي ترافيك فراهم شده است[7] به طوري كه حاوي 9 بلوك تابعي است و ميتواند به 100% دقت با كل 9 بلوك در عمل نزديك شود. محدوديتهاي عمده اين چنين سيستمي احتمالاً شامل سيستم توان عملياتي است و امكان اجرا در زمان حقيقي را ندارد. روشن و خاموش شدن BLINC [8] رويكرد ديگري مبني بر تشخيص الگوي عملكرد ميزبان براي طبقهبندي روند ترافيك ميباشد. اين براي متدولوژي مورد استفاده در اِي اِن تي سي قائم ميباشد، به طوري كه مبني بر عملكرد روند ترافيك ميباشد. در كارهاي بعدي، همچنين اميدوار به تركيب اين روش با اِي اِن تي سي هستيم كه بوسيلهي تفسير اطلاعات عملكرد ميزبان ميباشد و ميتواند توسط اِي اِن تي سي مورد استفاده قرار گيرد يك بررسي تجربي مقدماتي در الگوريتمهاي يادگيري ماشين متفاوت فراهم آمده است.[9] اين تمركز بر مقايسهي دقت و انجام عمليات الگوريتمها دارد، و به عنوان يك راهنماي خوب ورودي براي فراهم آوردن تكنيكهاي ماشين متفاوت در طبقهبندي ترافيك شبكه به كار گرفته ميشود. به هر حال نويسندگان ممكن است پيچيدگي اين مشكل را ناچيز بپندارند. براي طبقهبندي ترافيك آماري زمان حقيقي[10]، پيشنهاد ميشود روند مورد نظر بازي درون خطي [12]با يك پنجره اسلايد كوچك را مبني بر يك مدل مورد آزمايش در روندهاي فرعي كوتاه طبقه بندي كنيد.
شماري از اين آزمايشات در تشخيص بازي درون خطي يا وجود دارند، كه هر كدام يك نوع خاص درخواست ميباشند. قطع نظر از نتايج آزمايشي تحقيقات بيشتر براي اعتبار دادن به اين متدولوژي لازم خواهد بود.
3. معماري(ساختار):
يك چهارچوب طبقهبندي ترافيك شبكه زمان حقيقي مبني بر عملكرد روند به طور نظري شامل اين شيوههاي زير ميباشند:
ü تصرف پاكت: براي تصرف پاكت از يك واسط شبكه
ü تقسيم روند: براي جمعآوري و پاكتهاي جمعآوري شده در هر روند در يك موضوع روند منفرد
ü جمعآوري ويژگي: براي جمعآوري جريان يا روند مورد نياز براي طبقهبندي از موضوع روند منفرد
ü طبقهبندي : براي بررسي اين ويژگيهاي روند با يك مدل از قبل آزمايش شده، به منظور پيشبيني طبقهي درخواستي روند متعلق به آن.
اين روشهاي بالا از يك رد كامل روند داده و طرح اِي اِن تي سي به طور طبيعي براي يك ساختار لايهايي شده و تركيب با چهار لايهي يكسان دنبال ميشوند:
مدل لايهاي از دسترسي به طبقهبندي ترافيك شبكه بلادرنگ
تصرف پاكت و تقسيم جريان (روند) لايههاي انتهايي سيستم هستند كه باعث تقسيم ترافيك اصلي در يك سري موضوعات روند منفرد طبقهبندي شده است و اين مستقل از روشهاي طبقهبندي است. يك واحد تصرف پاكت شامل از كتابخانه ليپ كپ[13] استفاده ميكند، بنابراين هر دو ترافيك شبكه جاري و فايل ردگيري ترافيك(نسخهبرداريDump)[14] را پشتيباني ميكند. در لايه تقسيم روند، به طورجاري اِي اِن تي سي تنها پاكتهاي هر روند پروتكل كنترل انتقال را جمعآوري ميكند ديگر پاكتها مثل پروتكل برنامه كاربر و پروتكل كنترل پيام در اينترنت[15] از اين نمونه اوليهي صرف نظر ميكنند. همچنان كه اين روندهاي، پروتكل كنترل انتقال در جايي روند شروع ايِ اِن تي سي نديده است. ايِ اِن تي سي در شروع روند براي دو دليل تمركز يافته است: ابتدا، به طور قابل مقايسهايي براي نگه داشتن رد حالت اتصال آسان ميباشد،[12] كه اين بوسيلهي ِخواندن از شروع جريان (روند) ميباشد. دوم، شروع روند كه حاوي چندين ويژگي روند مؤثر ميباشد مثل سايز پنجره مقدماتي، از طرفي ديگر لايه ممكن است در كل نياز به روشهاي تقسيم جريان كاملاً متفاوت داشته باشد، بنابراين براي سادگي ما موقتاً تنها پروتكل كنترل انتقال را پشتيباني ميكنيم كه اكثريت ترافيك اينترنت را بوجود آورده است. [13] براي راه اندازي در نزديك به زمان حقيقي، بايد هميشه ايِ اِن تي سي نتايج طبقهبندي يك روند را برگرداند به محض اينكه تعداد اندكي از پاكتها در اين روند رسيدند. اين بدان معناست كه ممكن است تمام روندهاي پروتكل كنترل انتقال را به طور كامل جمع كنند اما يك شمار كوچكي از پاكتها را در عوض دارا ميباشد. به هر حال به چه تعداد پاكت با دقت كافي ميتوان دست يافت و اين سوال حل نشدهاي براي محققين است. بنابراين ايِ اِن تي سي به كاربر اجازهي تشخيص شمار ماكزيمم پاكتهاي نمونهي روند را ميدهد، و همچنين روند حداكثر ديگر پارامتر طول به عنوان يك تناوب براي تشكيل دهنده ميباشد.
در رأس لايه تقسيم، تجمع ويژگي و لايههاي طبقهبندي وجود دارند، كه هر دو مربوط به انتخاب روش طبقهبندي ميباشند به طور جاري ايِ اِن تي سي از چهارچوب (وكا)[16] [14] استفاده ميكند به طوري كه دامنه ي وسيعي از الگوريتمهاي طبقهبندي را تحت پوشش قرار ميدهد و شامل روش نايو بيز كه ما استفاده ميكنيم ميباشد و اين به خاطر توانا كردن جايگزيني دستي و توجيه متدولوژي طبقهبندي ميشود. در لايههاي جمعآوري ويژگي ده ويژگي جمعآوري شدند سپس در فرمت داده وكا ذخيره شدند كه به عنوان ورودي طبقهبندي ميباشند. در نهايت در لايه طبقهبندي ايِ اِن تي سي ، وكا[17] را براي طبقهبندي روند احضار ميكنند كه اين امر مبني بر مدل كرنل نايوبيز از پيش آزمايش شده ميباشد كه باعث فراهم آوردن نتايج خروجي ميشود. ما همچنين در مورد متدولوژي نايوبيز كه در بخش بعد از آن استفاده ميكنيم بيشتر بحث خواهيم كرد. از طرفي ديگر ايِ اِن تي سي همچنين يك الگو براي جمعآوري ويژگيهاي روند ديگر فراهم آورده است بنابراين پس از اين براي سادگي انجام عمليات روش شناسي طبقهبندي از ويژگيهاي متفاوت والگوريتمهاي گوناگوني استفاده ميكنيم. برخي از اين واحدها ميتواند در كنار هم تركيب شوند به عنوان مثال جمعآوري ويژگي نميتواند به حد لازم بعد از انتهاي تقسيم روند شروع شود. به هر حال آنان را به دو واحد متفاوت نگهداري شده پيمانهايي با هزينهي افزونگي محاسبه تقسيم كنيد. سودمندي پيمانهايي دو دسته است:
اول اينكه اجازه ميدهد تا اپراتور شبكه به راحتي اين نرمافزار را به درخواست مونيتورينگ[18] شبكهشان اضافه كند و همچنين به ديگر محققين به راحتي اجازهي كاربرد روششناسيهاي متفاوت يا واحدهاي تصرف پاكتگرا ميدهد. اگر چه انجام عمليات روش نايوبيز با تخمينزن كرنل[2] اخيراً ساخته شده است، و اين تنها يك نقطهاي شروع است و ما آنها را تشخيص داديم كه اين ميتواند چندين رويكرد متفاوت باشد. ما ميتوانيم از ايِ اِن تي سي براي سهولت تحقيقات استفاده كنيم. واحدهاي بالا از ايِ اِن تي سي در سي انجام ميشوند در حالي كه وكا مبني بر جاوا ميباشد. بنابراين ميانجي كمكي محلي براي جاوا[19] [15] براي احضار وكا از سي مورد استفاده قرار ميگيرد.
4. روششناسي طبقهبندي براي سيستم بلادرنگ
انجام عمليات بلادرنگ زمان حقيقي متدولوژي طبقهبندي نياز به تغير و تبديل و تنظيم در چندين جنبه دارد. طبقهبندي ترافيك زمان حقيقي كمك به فراهم كردن ورودي براي سيستمهاي تشخيص نفوذ خدمات ميكند كه نياز به تشخيص و تعيين ابتدايي يك روند ترافيك دارد. اين اشاره به آن دارد كه طبقهبندي بايد با اطلاعات محدودي از تعداد هر چه كمتر پاكت متفاوت از كل روند به اتمام برسد. كاهش /تعداد/ پاكتها در نمونههاي روند ممكن است باعث كاهش محاسبه در جمعآوري ويژگيها شود كه در شكل 2 آن را نشان داديم. مجموعاً كاهش تعداد ويژگيهاي جمع شده باعث كاهش محاسبه و حافظه در ويژگيهاي جمعآوري شده در طبقهبندي ميشود. به هر حال در مقايسهي ايدهآل اطلاعات بيشتر در يك روند نياز به فراهم آوردن دقت بيشتر داريم.
براي حل اين تناقض، براي سيستم طبقهبندي تحت سرپرستي مثل مال ما، چالش يافتن يك مدل طبقهبندي دقيق براي روندهاي بخش با شمار محدود پاكتها ميباشد. مشكل سه بعدي است: 1) مدل بايد در يك ويژگي دقيق با محاسبات محدود تعلم يابد و حافظه بايد آورده [20]باشد اما حاوي مقدار زيادي اطلاعات در جهت تصحيح نمونههاي داده (روندهاي شبكه[21]) طبقهبندي شده باشد كه در طبقات كاربري هستند 2) براي تصحيح مدل، بايد اطلاعات كافي فراهم شود ، از يك شمار كافي نمونههاي با داده صحيح در هر طبقه درخواست استفاده كنيد كه به شكل غيرانحرافي نگه داشته شدهاند. 3) خود مدل بايد داراي حداقل پيچيدگي محاسباتي ممكن باشد.
مدل جاري ما مبني بر مدل نايو بيز[2] قبلي ميباشد.اِي اِن تي سي ده ويژگي ليست شده در جدول در پايين را براي طبقهبندي شبكه در 10 طبقه دلخواهي جمعآوري كرده است. ويژگيهايي كه ما استفاده كرديم براي آنها كه انتخاب كردهايم با [2] مساوي ميباشد، و مؤثر بودن آنها را در روند كلي طبقه بندي به اثبات رسيده است. تنها تفاوت در انجام عمليات آن است كه ما ويژگيها را از شمار محدودي از پاكتها جمعآوري كردهايم كه اين در آغاز روند بيشتر از نمونههاي روند كلي بود. شكل 2 رابطهي بين شمار محدود پاكتهاي متفاوت و محاسبهي اين ويژگي را نشان ميدهد. به طوري كه تقريباً خطي ميباشد.
چون ما روي آغاز روندها تمركز كردهايم، ما مدل خود را با استفاده از آغاز روندهاي محدود شده توسط شمار حداكثر پاكتهاي يكسان،توليد كرديم همانطور كه آنها را در طبقهبندي مورد استفاده قرار داده بوديم اين يك راه حل طبيعي مبني بر نقش ساده اطلاعات آموزشي و آزمايش اطلاعات است كه بايد هميشه با يكديگر اتصال داشته باشد.
|
پیچیدگی |
حافظه سرجمع |
زمان جمع آوری |
نام |
|
O(1) |
O(1) |
مدت گرفتن |
قرار دادن- بسته های- خدمتگزار |
|
O(1) |
O(1) |
مدت گرفتن |
نخستین- پنجره- بایت ها - خدمتگزار |
|
O(1) |
O(1) |
مدت گرفتن |
نخستین – پنجره – بایتها – مشتری |
|
O(1) |
O(1) |
مدت گرفتن و قبل از اتمام |
متوسط – قطعه – اندازه- خدمتگزار |
|
O(n) |
O(1) |
قبل از اتمام |
Ip – داده – بایت – میانگین – مشتری |
|
O(n) |
O(n) |
مدت گرفتن |
واقعی – داده - بسته ها- مشتری |
|
O(n) |
O(n) |
قبل از اتمام |
داده – بایتها – واریانس – خدمتگزار قبل از اتمام |
|
O(n) |
O(1) |
مدت گرفتن |
کمترین – قطعه – اندازه – مشتری |
|
O(n) |
O(1) |
مدت گرفتن |
Rtt – نمونه ها – مشتری |
|
O(n) |
O(1) |
مدت گرفتن |
قرار دادن – بسته ها - مشتری |
جدول 1 : لیستی از ترکیبات مورد استفاده در نايو بيز که طبقه بندی جزئیات خام از این ترکیبات قابل دسترس میباشد.
5. نتايج آزمايشي
پايگاه داده ما شامل دوروند وقفه از ترافيك اينترنت ميباشد.مرحله 2 هشت ماه بعد از مرحله 1 است. اين پايگاه داده با استفاده از يك جعبه مونيتورينگ با سرعت بالا جمعآوري [17] شده كه در اتصال اينترنت، شبكه، از فضاي باز ژنوم[22] نصب شده است.
فضاي باز يك تحقيق ساده با حدود 1000 كارمند است كه به اينترنت از طريق يك پيوند اترنت گيگا بايت كاملاً (دو رشتهاي) اتصال دارند.هر پاكت در هر مسير پيوند با يك بار مفيد كامل تصرف ميشود. سپس پاكتها توسط دست در ده طبقه درخواست طبقهبندي ميشوند، چون اساس كار براي آزمايشگري، يعني شبكه گسترده جهاني[23] ، پست الكترونيكي[24] و حمله[25]، همكار به همكار[26] ، پايگاه داده [27] ، چند رسانهاي[28]، خدمات انفعالي[29]، بازيها[30] و تود ميباشند. محاسبهي مرحله 1 و مرحله 2پايگاه داده در جدول 2 نشان داده شده است.
شكل 2 : ويژگي زمان جمع آوري وي اس. روند اندازه نمونه.
|
اکثریت |
بازی |
INTR |
SERV |
MMED |
DB |
P2P |
ATT |
بسته پستی |
WWW |
مجموع |
|
|
12309 |
5 |
86 |
1798 |
444 |
2794 |
1908 |
2548 |
28120 |
273867 |
323879 |
روز اول |
|
10793 |
0 |
36 |
1112 |
4 |
2606 |
2762 |
987 |
16483 |
140868 |
175651 |
روز دوم |
جدول شماره 2،مجموعه دادههای از دو تا از روزهای غیر متوالی با یک فاصله از ماههای هشتم
در آزمايش ما به بررسي 5 نمونه روند متفاوت با محدوده طولي پرداختيم يعني پاكتهاي 5،10،25،50،100 تايي. ابتدا، اعتبار سراسري طبقهطبقه را جمعآوري كرديم،[14] نتايج از وكا براي هر مجموعه، دادهاي روزانه مقادير درست كلي مدلها مبني بر اين نتايج محاسبه شدهاند همچنانكه دقت و به يادآوري مقادير براي سه تا از طبقات بزرگ درخواست انجام ميشود: شبكه گسترده جهاني، پستالكترونيكي ، توده.
![]()
با توجه به
اين نتايج ميتوان فهميد كل صحت براي مرحله 1 و مرحله2 با استفاده از محدوديتهاي
پاكت متفاوت ميباشد. با توجه به آن مقدار كم 5 پاكت صحت كلي هر مجموعه داده ميتواند
به 90% برسد و با 25 پاكت مرحله 1 ميتواند به بالاي 93% دست يابد در حالي كه مرحله
2 به صحت 97% به طور شگفتآوري دست پيدا ميكند. براي مقايسهي مطالعاتي، همچنين
به بررسي كامل نمونهسازي روند با استفاده از متدولوژي نايوبيز كه در مجموعه دادهاي يكساني ساخته شده است
پرداختيم اين نتايج در 5/96% و 8/95% صحت براي مرحله1 و مرحله 2 ميباشند.
بنابراين حتي ويژگيهايي كه ما براي آغاز روند نمونهها مورد استفاده قرار دادهايم يكسان است چون آنها براي نمونههاي با روند كلي انتخاب شدند.[2] نتايج از اين ويژگيها ميتواند به عنوان يك سطح يكسان از جهت مورد توجه قرار گيرد.
![]()
علاوه بر اين
به خاطر معتبر كردن تبادل موقتي مدل، ما به بررسي اعتبار سراسري بين دو مجموعه دادهاي
پرداختيم. دقت ممكن است با زمان دچار زوال شود و اين بواسطهي ظهور درخواستهاي
جديد تغيير ترافيك اينترنت ميباشد. اگر چه برخي سطوح كاهشي در كل صحت ميتواند در
نتايج ما ديده شوند. مدل هنوز قادر به فراهم آوردن اطلاعات سودمند در روند ميباشد.
به عنوان مثال مقدار يا ارزش ترافيك شبكه گسترده جهاني ميتواند داراي برخي توسعههاي
قابل اطمينان باشد. در مقايسه، نمونهگيري روند كلي در 94% و 92% ديده شده است.
6. نتيجهگيري و كارهاي آينده:
چندين عامل مهم در سيستم طبقهبندي ترافيك آن لاين وجود دارد مثل صحت، تماميت، چالشها در بهبود اجراي كلي همچنين در تعادل بين اين فاكتورها يك فاصله مشكل پيچيده را بوجود ميآورند. ما تصديق ميكنم كه نتايج ما و آزمايشاتمان در تحقيقات طبقهبندي زمان حقيقي ارائه شده در اين مقاله تلاش داشته كه به شكل ساده و غير مبهم موارد را بازگو كند . ما همچنين يادداشت كرديم كه مواردي از رويكردهاي آماري جاري وجود دارند.
به عنوان مثال تكنيكهاي قابل اعتماد و آماده بطور عملي به اطلاعاتي حداقل با پاكتهاي كم نياز دارد قبل از اينكه بتواند يك پيشبيني قابل اطمينان در يك روند ناشناخته انجام دهد. اين به معناي نهفتگي در طبقهبندي ترافيك آماري ميباشد كه احتمالاً بالاتر از سه پيام سنتي و مكانيزمهاي مبني بر امضاء ميباشد راهي براي حل اين مشكل ميتواند دريچههايي را براي كارها آينده باز كند، كه اين به طور عمدهايي بستگي به هدف سيستم طبقهبندي زمان حقيقي دارد. به هر حال يك طبقهبندي ترافيك پيچيدهتر باعث تركيب مقاومت رويكردهاي متفاوت ميشود كه اين براي جواب دادن به اين مشكل اميدوار كننده خواهد بود. اين ميتواند يك چالش باشد اما نه يك محدوديت براي سيستمهاي طبقهبندي ترافيك كه در زمان حقيقي راهاندازي شدهاند.
در اين مقايسه، ساختاري از اِي اِن تي سي را فراهم آورديم: يك سيستم چهارچوب طبقهبندي ترافيك آماري كه در يك شبه سيستم بلادرنگ طبق اِي اِن تي سي اجزاي سيستم متدولوژي طبقهبندي نايوبيز را مطرح كرديم با جمعآوري ويژگيها در آغاز روندها نتايج آزمايشي ما نشان ميدهد اين روش طبقهبندي ميتواند به سطح يكساني از صحت دست پيدا كند به طوري كه در طبقهبندي ترافيك برون خطي مورد استفاده قرار ميگيرد. اِي اِن تي سي يك چهارچوب ساده است اما به عنوان يك ابزار قدرتمند براي كشف كل فضاي مشكل شروع ميشود. اجازه وي مجموعههاي با ويژگيهاي متفاوت را ميدهد. از طبقهكنندههاي متفاوتي استفاده ميكند و پارامترهاي نمونهسازي روند را ميزان سازي ميكند. اِي اِن تي ميتواند به راحتي باعث تسهيل تحقيقات بيشتر براي تشخيص مناسبترين مجموعه ويژگيها شود و ميتواند باعث تسهيل الگوريتم طبقهبندي زمان حقيقي شود علاوه به آن اِي اِن تي سي با محتويات ساخته شده در آيندهايي نزديك مجهز خواهد شد، بنابراين يك تحقيق كامل براي طبقهبندي ترافيك در شبكههاي با سرعت بالا در حال شكلگيري است.
1- Approaching Real – time Network Traffic classification (ANTC)
[2] - Naïve Bayes
3- Class- of- service(Cos)
4- Kernel
1- intrusion detection systems (IDS)
2- Internet Protocal(IP)
3- Trans mission control protocol(TCP)
4- User datagram protocd(UDP)
6- سيستم ايمني سختافزار يا نرمافزار بين سرور يا انترنت و انترنت عمومي (مترجم)
7- Post office protocol (version tree) (pop3)
8- Simple Mail transport protocol (SMTP)
2- On line game
1- Libp/cap
-2Dump
-3 Internet control message protocol(ICMP)
4- Weka
-1monitoring
[19] - oava Native Interface (JNI)
1- Network flows
1-Genome campus
2-World wide web (www)
3- Electronic Mail (EMALI)
4- ATTACK
5- Data Base
6- Multi Media
7- INTERA ction Service
8- Games
9- Bulk