याहूचे गैरवर्तन अल्गोरिदम 90% वेळ कार्य करते

संगणक अल्गोरिदम मदत

याहूच्या बातम्या लेखात उर्वरित इंटरनेटप्रमाणेच बर्‍यापैकी अस्पष्ट टिप्पण्या आहेत, म्हणूनच याहू कार्यसंघाने यशस्वीरित्या सर्वात वाईट अपराधी ओळखू शकतील अशा अल्गोरिदम विकसित करण्यासाठी त्यांच्या टिप्पण्या विभाग वापरण्याचे ठरविले. त्यांचे नवीन गैरवापर-शोधणारी अल्गोरिदम 90 ० टक्के वेळ काम करते, ज्याचे म्हणणे आहे की ते इतर संघटनांच्या प्रयत्नांपेक्षा अधिक प्रभावी ठरतात आणि असेच पुढे क्षेत्रातील एक मोठे पाऊल आहे. 90 टक्के करते खूप छान वाटतंय, मी कबूल करतो.

वायर्ड गैरवर्तनाचा सामना करण्यासाठी याहू त्यांच्या प्रकल्पाचा एक भाग म्हणून ऑनलाइन द्वेषयुक्त भाषणाचा पहिला सार्वजनिकरित्या उपलब्ध क्युरेटेड डेटाबेस देखील जारी करीत आहे. याचा अर्थ असा की इतर साइट त्यांच्या अल्गोरिदम डिझाइन करण्यासाठी याहूच्या टिप्पण्यांचा डेटाबेस वापरण्यास सक्षम असतील. याहूचे अल्गोरिदम मशीन शिक्षण आणि त्यांच्या टिप्पण्या विभागांबद्दल वापरकर्त्याने-अहवालानुसार डेटावर आधारित विकसित केले होते.

कोणत्याही कमेंट-मॉडरेटिंग अल्गोरिदमचा सर्वात अवघड भाग खोटे पॉझिटिव्हशी संबंधित आहे. बरेच गैरवर्तन-शोधून काढणारे अल्गोरिदम विशिष्ट शब्द किंवा वाक्ये शोधतात, जसे की स्लर्स किंवा सामान्य अपमान करतात आणि टिप्पण्या नियंत्रित करण्यासाठी आपोआप ध्वजांकित करतात. तथापि, परिणामी टिप्पण्या ध्वजांकित होत आहेत जरी ते योग्य नाही असे म्हणण्याच्या संदर्भात एखाद्या गोंधळाचा संदर्भ देत असतील, उदाहरणार्थ, किंवा टिप्पणी एखाद्या ट्रोलची व्यंगात्मक अनुकरण असेल तर. याहूचे अल्गोरिदम वरवर पाहता काही विशिष्ट भाषण नमुने शोधू शकतात आणि हे जॉकी उपहास आणि वास्तविक गैरवर्तन यातील फरक सांगण्यात सक्षम होण्यासाठी डिझाइन केलेले आहे. (नक्कीच, जर तुमची हास्यास्पद टिप्पणी वास्तविक गैरवर्तनापासून वेगळी असेल तर मला खात्री आहे की अल्गोरिदम अद्याप त्यावर ध्वजांकित करेल, परंतु एआयचा तो भाग कसा कार्य करतो हे मी निश्चितपणे सांगू शकत नाही.)

याहूने अल्गोरिदम परिपूर्ण करण्यासाठी मदतीसाठी प्रशिक्षित कमेंट मॉडरेटरची यादी केली आणि त्यांनी काही प्रशिक्षित नियामकांना पैसेही दिले आणि त्यांना असे आढळले की कोणत्या टिप्पण्या योग्य आहेत हे शोधण्यात प्रशिक्षित नियंत्रक बरेच चांगले आहेत (एक प्रकारचे ब्रेनर नव्हते, परंतु अहो). एआय तयार करताना, याहू यांना असे आढळले की अल्गोरिदमची कार्यक्षमता टिकवून ठेवण्यासाठी आणि त्या शोधण्याच्या तंत्रांना परिपूर्ण करण्यासाठी या प्रशिक्षित मानवी नियंत्रकांचे कार्य आवश्यक आहे.

अर्थात, अल्गोरिदममध्ये अद्याप बाईस आहेत , ज्या टिप्पण्यांचे वर्गीकरण करण्यासाठी वापरल्या जाणार्‍या पद्धतींवर पुनरावृत्ती करण्यासाठी मानवी नियंत्रकांच्या (आशेने वैविध्यपूर्ण) कार्यसंघ आवश्यक आहे. खडतर नोकरीसारखे वाटते, परंतु कमीतकमी याहू आता त्यांचे चांगले प्रशिक्षण घेतलेले मानवी नियंत्रक आणि त्यांचे नवीन एआय सहकारी अशा दोघांच्या भूमिकांना प्रशिक्षण देणे आणि त्यांचे मूल्यांकन करण्याचे महत्त्व समजते.