12分鍾閱讀

入耳洞見:當算法選擇出錯時

通過克裏斯托弗·s·佩恩2022年7月1日

播客

編者注:本文經Trust Insights授權轉載，該公司幫助營銷人員解決/實現收集數據和衡量其數字營銷努力的問題。

在本周的In- ear Insights中，凱蒂和克裏斯討論了當初級或幼稚的AI工程師或數據科學家對算法做出錯誤選擇時會發生什麼。

通過一個寫作分析網站的例子，我們討論了什麼是錯誤的，什麼是合適的選擇，以及為什麼事情可能會偏離正軌。最重要的是，我們討論了防止這種情況發生的方法，以及QA對於AI作為一個持續過程的重要性。

訂閱我們的節目!

如果你還沒有訂閱In-Ear Insights，現在就開始吧!

讚助這個節目!

你是否在努力接觸到合適的受眾?Trust Insights在我們的時事通訊、播客和媒體屬性中提供讚助，以幫助您的品牌被正確的人看到和聽到。我們的媒體屬性每周達到近10萬人，從In Ear Insights播客到幾乎及時和在車燈時事通訊。今天就來我們這裏了解更多．

點擊這裏觀看視頻:

什麼也看不見?請在YouTube上觀看．

在這裏下載MP3音頻．

機器生成的記錄

以下是人工智能生成的文字記錄。文字記錄可能包含錯誤，不能代替聽一集。

克裏斯托弗·佩恩0:02
這裏是In-Ear Insights Trust Insights播客。

AI營銷學院是一個在線教育平台，旨在幫助像你這樣的營銷人員了解試點和規模的人工智能。

AI學院的特色是3至5小時的深度認證課程，以及數十門30至60分鍾的短期課程，每門課程由領先的AI和營銷專家教授。

Jordan Katie Robbert，我是Christopher Penn Trust Insights的首席數據科學家負責我們學院三門課程的5個AI用例內容營銷，營銷的智能歸因建模，以及檢測和減輕營銷AI中的偏見。

該學院主要麵向經理級別和市場營銷人員以上的人群，主要麵向非技術受眾，這意味著你不需要有編程背景或數據科學背景來理解和應用你所學的知識。

一次注冊可以讓你無限製地訪問所有的課程，並邀請一個成員隻鬆弛實例，每個季度訪問新課程。

現在加入並節省100美元的注冊時，你去信任的見解。ai斜杠ai學院，使用注冊碼筆100今天，這是信任的見解。在本周的in - ear Insights中，我們將討論數據科學、機器學習和ai的算法選擇。

不久前，我在我的作家小組裏有一個對話，有人發現了這個看起來很有趣的工具，叫做AI，你要做的就是把你寫過的文章粘貼進去，它會告訴你你最喜歡哪個作者。

這聽起來很酷。

但是我小組裏的一些人說這個東西好像不太好用。

他們開始你們知道，他們我的一個朋友在這個帖子上說你寫的是，rice還有一些人寫的是，你知道Lele Tolstoy，然後是Cleverley。

我的同一個朋友貼出了那個作者的真實版本，就像在對一個吸血鬼的采訪的最後一部分，他說，這個人寫了像Stephenie Meyer那樣的東西，哇，應該是，這太容易受折磨了，說這是Rice的作品。

她說你寫得很像，但並沒有。

當你打開網站上的“關於”頁麵，它說，你知道，這是我們建立的一個人工智能項目。

我們用樸素貝葉斯分類器來做這個很酷的事情。

我讀到，我認為用樸素貝葉斯算法是絕對錯誤的。

分類器是用來過濾垃圾郵件的，但它的作用在這裏是一種叫做文體學的特殊學科。

這是完全錯誤的。

我喜歡這個。

你可能，你可能錯得更離譜。

但要做到這一點需要付出努力。

這就引出了一個問題，這是誰幹的?,為什麼?為什麼他們會做出這些選擇，因為從一個局外人的角度來看，作為一個數據科學家，我看到了這些，然後離開了。

這是由一個不知道自己在做什麼的人整理出來的這個人不是數據科學家，可能是程序員。

它提出了一個非常重要的問題，我想問你，凱蒂，那就是，當你有一些人在構建數據科學的東西，為網絡構建這些工具，它可以是有趣的應用，但咖啡，非常嚴肅的應用，像營銷自動化，他們選擇不適合任務的算法時，你會怎麼做。

他們選擇算法，因為這可能是他們知道的，或者是他們讀到的關於雜誌的東西，但這是錯誤的。

你怎麼怎麼防止呢?你如何彌補這一點?

凱蒂中3:39
好吧，讓我後退一步，因為對於一般的營銷人員，他們不是數據科學家，他們不會他們不一定會去關於頁麵並閱讀。

這是我們選擇的算法，哦，這是錯誤的算法。

你舉的例子其實是一個很好的QA部分。

有一個過程來說明，這個東西是否像預期的那樣工作，因為我們作為營銷人員和消費者所遇到的麻煩是，我們傾向於向前走，相信擺在我們麵前的技術，說，好吧，這是技術。

所以它必須是正確的它必須在做，它必須已經知道它應該做什麼，或者建造它的人必須知道它應該如何工作。

他們一定選擇了正確的算法。

在你的例子中，當你把作者輸入到算法中，它會返回一個像這樣的其他人，這顯然是第一個線索，這個東西不能正常工作。

對於那些不知道的人來說，應該選擇特定的算法，這是一個很好的測試方法。

所以你有測試者，然後你有構建者創建算法的人有責任知道我是否選擇了正確的。

所以你如何選擇正確的，這需要一些盡職調查，需要一些研究，需要一些概念的證明。

它需要一些測試，就像，它回到了軟件開發生命周期或者科學的方法，你不隻是把技術扔到一個解決方案上，來產生你想解決的問題。

你得弄清楚我要解決的問題是什麼?然後開始探索什麼是可行的，什麼能讓我得到答案。

所以在這個例子中，你知道，你寫的算法是誰，是創造秩序的人還是創造秩序的團隊?理想情況下，聽起來像是他們沒有盡職調查但應該做一些測試如果我輸入大米和她的內容，它應該吐痰如果我輸入斯蒂芬·金，它應該吐痰斯蒂芬·金如果我輸入斯蒂芬妮·邁耶，它應該選擇那個測試斯蒂芬妮·邁耶聽起來事情是這樣的，他們取了一些人們寫的主題的關鍵詞，比如吸血鬼。

安妮·賴斯寫了對吸血鬼的采訪，而斯蒂芬妮·邁耶寫了《暮光之城》。

這兩部關於吸血鬼的故事都非常不同。

但是它們的共同點，重疊，維恩圖就是吸血鬼這個詞。

所以在我這個局外人看來，另一個房間的人會說，哦，這是關於吸血鬼的。

一定是斯蒂芬妮·邁耶的。

這對我來說是有問題的。

克裏斯托弗·佩恩6:28
是的。

其中很大一部分，我，我在爭論你是否應該有主題方麵的專業知識，比如《暮光之城》和《五十度灰》。

但現實情況是這裏缺少的不是技術而是人們沒有專業的寫作知識來理解這是一整個自然語言處理的小節，致力於寫作和寫作分析。

這也被稱為文體學，如果你不知道寫作，你不知道自然語言處理，你需要這兩個領域的專業知識。

在這個軟件的例子中，把它放在一起的人兩者都沒有，但他們用樸素貝葉斯分類器，這就像垃圾郵件過濾，它看起來不像垃圾郵件是或否，這是一個非常不同的應用，與語言上的不同。

你的寫作和這兩件事有什麼相似之處嗎?因為Stephenie Meyer的寫作風格非常不同。

在這種情況下，如果你使用合適的算法，我們稱之為餘弦相似度，它可以很容易地將兩者分開，然後說，哇，這是兩個完全不同的人。

我們如何阻止這種情況的發生，在任何關鍵的任務應用中，我的意思是，當然，質量保證很重要，但你不能等待完成的產品的質量保證。

凱蒂中七59
同意，你知道，這回到，你知道，這是我們放在一起的人工智能生命周期。

它基本上涵蓋了業務需求、數據需求、模型和算法需求。

所以，你知道，這是貫穿這些問題的共同線索。

是計劃的一部分嗎?你停下來製定計劃了嗎?或者你隻是想盡快推出一項技術，這樣你就能在人工智能的噪音中發出自己的聲音?我猜是後者而不是前者，所以人們隻是試圖匆忙地把一些東西拚湊在一起，把一個簡單的網站界麵放在上麵，然後說，讓人們開始使用我的東西。

這樣我的名字就能出來了。

這是絕對錯誤和不負責任的人工智能方式。

我把做AI放在這個大引號裏，因為美國的AI創造了AI，談論AI，就像現在世界上正在發生的疫苗一樣，跳過了所有的臨床試驗過程，這是非常不負責任的。

現在我們談論的人工智能不是生或死。

但它可能是，它可能是決定生死的一部分，而這些疫苗，真的是生死攸關。

他們跳過了過程中重要的部分，包括計劃、測試、重新測試、重新種植和調整，他們隻是想把一些東西推出去，隻是想成為第一個進入市場的人。

人工智能就像你不能負責任地把東西扔到門外，然後說我是第一個上市的。

必須有這樣一個過程。

我很抱歉，這個過程可能很無聊，令人生畏，但你不能跳過它，然後負責任地說，我為你創造了一些東西。

給你，用它。

克裏斯托弗·佩恩9:57
在這種情況下，可能不是生死攸關。

但它可能是終身質量的文體測量軟件被用於刑事司法應用，就像有人寫了這張紙條嗎?你知道，所謂的證據就是可接受的證據。

所以，這絕對應該與任何人有關，當你聽到這樣的事情，就像，嘿，這個人建立了一個商業應用程序，在法庭上被使用，也許告訴陪審團，嘿，你知道，這個人寫了這個東西，而實際上，他們並沒有。

凱蒂中31
對吧?不,我認為這是一個很好的例子,因為我們認為的寫作分析而言,你知道,我是剽竊或你知道的,我語法正確的語法,例如,是一個真正偉大的工具,隻是經過,並確保你有正確的標點和正確的動詞時態和這些事情,但是當你真的認為進一步,分析別人的寫作,在文體上,你知道,這是你知道的注意,一個跟蹤我一年的人寫的?還是說這隻是有人在明知情況如此的情況下想耍我?那是生死攸關的事嗎?因為這可能意味著某人會不會進監獄。

克裏斯托弗·佩恩11:13
是的。

所以我們必須建立QA，我們必須在這個特定項目中更好地定義業務需求，即使這是一個有趣的項目，可能仍然會有這樣的業務需求，你知道，得到正確答案的概率是95%，而不是得到正確答案的概率是40%左右。

凱蒂中十一33
好吧，我認為，你知道，這要回到公開發表這篇文章的人的責任上來，因為，你知道，這是你的聲譽。

人們注意到的是你的技能。

所以，你知道，我想說，大多數人可能不知道去思考尋找這些東西。

他們可能會說，哦，這隻是一種樂趣。

你看，我的寫作風格就像約翰·格裏沙姆。

你知道，然後說，哦，這很有趣，隨便吧。

但你也會遇到像你這樣的人和你的寫作小組裏的人他們非常認真地對待寫作，他們以寫作為職業，以寫作為生，他們會對寫作持懷疑態度和批評態度。

你完全正確。

聽起來像是缺失的一部分。

他們做的這個項目是關於主題的專業知識。

現在，你需要成為地球上每一個作家的主題專家嗎?不，那是不可能的事。

所以這可能意味著你需要一些不同的，你知道，不同類型的顧問和專家來權衡，然後問，這看起來是正確的嗎?我認為關鍵在於人工智能很少是一個單獨的項目。

你必須擁有一個由來自不同背景的不同人組成的團隊，這樣才能真正地權衡和檢查。

這東西像預期的那樣工作嗎?我們是否發布了一些負責任的東西，給人們提供正確的信息，即使它隻是一件有趣的事情，因為你不知道它會變成什麼樣子。

克裏斯托弗·佩恩13:05
說到這，審計的過程有多奇怪呢尤其是外部審計師的評論，因為通常情況下，外部審計師對一個項目或公司進行審計就像財務審計師，在納稅年度末，納稅年度初，在可能產生稅收影響的實際行動發生很久之後才來。

他們隻是去核實你是否做了你說過要做的事，你是否遵守了法律。

當涉及到AI時，聽起來我們需要在一個完全不同的地方進行審計，而不是Hey，你做了你推出的事情，並將證明你正確地做了事情。

這就是Facebook道德審查的情況。

審計員來了，標出了一大堆問題，並說，嘿，你知道那些事情，就像去年的審計一樣，你仍然解決了它們。

凱蒂中13:49
是的，你知道，這很有趣，因為你不一定能預測一款軟件會去哪裏，或者它會對公眾產生什麼影響。

所以在Facebook的例子中，顯然這是非常糟糕的處理。

一旦你發展到如此大的規模，它就應該成為常規流程的一部分，在更一致的基礎上做一些事情。

這不是一蹴而就的。

然而，你知道，我們談論的是這個，你知道，文體寫作算法。

當他們在做要求的時候，他們可能應該問的問題是，如果我們得到了回應，我們知道它是否正確嗎，好吧，我們不知道，因為我們不熟悉米飯或斯蒂芬·金或其他人?我們能不能去找一個大學教授，他會教美國恐怖小說，或者教古典文學之類的東西，然後說，嘿，我們能不能用你的專業知識說，如果我們把太陽放在上麵，結果看起來就像它回來了?我們應該注意哪些細微差別，所以有辦法提前做好。

然後在迭代過程中始終如一。

這並不是說你要支付顧問100%的時間。

但是你建立了這些檢查點和裏程碑，嘿，你能看看這個東西嗎?確保它看起來仍然正常工作。

克裏斯托弗·佩恩15:13
是的。

或者在這個特殊的應用中，讓顧問說，這就是為什麼我認為你的軟件選擇了錯誤的東西來衡量。

所以，你知道，在文體學中，你傾向於看最常用的單詞，來了解你知道的頻率，有一些單詞不提供預測價值，比如a和，但還有一些單詞在常規的自然語言處理中被過濾掉了，它們被稱為停止詞，a和但也有一些單詞，如代詞，我，你，等等。

這些代詞在文體學中的使用是非常重要的，它們不能被刪除，因為這能告訴你作者是否傾向於用第三人稱還是第一人稱寫作，多久寫一次之類的，這些都是重要的線索。

所以外部專家應該能說，是的，這就是為什麼你在受苦。

在它似乎缺失的地方，比如當它並排比較結果時，它看起來不懂代詞，你可能想要去解決這個問題。

在這種情況下，因為他們選擇的結果，他們甚至沒有嚐試去做他們隻是嚐試去做，基本上是盲目的分類。

總而言之，當涉及到部署人工智能，或者機器學習，或者坦白地說，任何算法時，你需要三個東西，你需要技術，你需要真正好的過程，包括需求收集和驗證需求。

你需要擁有擁有正確技能的正確的人來完成它。

你不能隻做其中的一件事，正如這個技術例子所顯示的，他們專注於技術而排除了過程中的人。

最終的結果是一個應用程序不會做你認為它會做的事情或者它應該做的事情。

如果你正在做一個數據科學或人工智能項目，或者隻是一個普通的分析項目，你對算法有一些疑問，請訪問我們為市場營銷人員提供的免費群體分析。Ai削減了營銷人員的分析能力。

你可以和超過1200個人進行有趣的對話。

就在今天早上，我們還在討論使用人工智能將主唱從歌曲中移除，隻給你他們的聲音，或者隻給你背景。

如果你想做一些卡拉ok混音，有一個人工智能可以幫你。

這就是從標記中找到它的方法。

如果你對這期節目有意見，請轉到Trust insights。謝謝收聽。

我們將盡快與您交談，希望幫助您解決公司的數據分析和數字營銷問題。

這就是Trust的見解。讓我們知道我們能如何幫助你

克裏斯托弗·s·佩恩

Christopher S. Penn是Trust Insights的聯合創始人兼首席數據科學家。

入耳洞見:當算法選擇出錯時

訂閱我們的節目!

讚助這個節目!

機器生成的記錄

克裏斯托弗·s·佩恩

關於

伟德bv885

教育

訂閱我們的時事通訊，獲得獨家人工智能內容:

入耳洞見:當算法選擇出錯時

訂閱我們的節目!

讚助這個節目!

機器生成的記錄

克裏斯托弗·s·佩恩

相關的帖子

[營銷AI秀:第一集]Salesforce Leader討論後AI消費者

以下是營銷人員的人工智能學院的新動向

[營銷人工智能秀:第二集]Microsoft Exec涵蓋對話式人工智能