인공지능 Ai

AI는 인공뉴런을 사용한 데이터 홍수에서의 처리 능력

AI 탐구러 2021. 1. 12. 18:10

 

세상은 데이터로 넘쳐나고 Anshumali Shrivastava는 우리가 그 속에 빠져드는 것을 막을 수 있습니다. 하루에도 10억장 이상의 사진이 인터넷에 올라옵니다. 1초 안에 대형 Hadron Collider1백만 기가바이트의 데이터를 만들 수 있습니다. 빅 데이터는 현재 컴퓨터 프로그램이 분석 할 수 있는 것보다 빠르게 성장하고 있습니다. 휴스턴에 있는 Rice University의 전기 및 컴퓨터 엔지니어인 Richard Baraniuk는 우리는 엄청난 양의 데이터를 가지고 있으며 파이프를 통해 데이터를 빨아 들여야 한다고 말합니다. 그래서 컴퓨터 과학자 Anshumali Shrivastava는 정보의 홍수를 효율적으로 처리하기 위한 차세대 인공 지능 프로그램을 설계 중에 있습니다MIT의 전기 엔지니어이자 컴퓨터 과학자 인 Piotr Indyk는 그는 매우 창의적이라고 말합니다. 이것들 중 일부는 내가 그것을 생각해 냈으면 좋겠다고 말합니다. Shrivastava는 실제 문제를 해결하는 숫자 처리 알고리즘이 수학이 실제로 실행되는 곳이기 때문에 인공 지능에 뛰어 들었습니다. 그러나 Ph.D. 코넬 대학의 컴퓨터 과학 학생인 Shrivastava는 오늘날의 프리미어 AI 프로그램인 인공 신경망이 실제로 비효율적이라는 것을 인지했습니다. 신경망은 인공 뉴런이라고 하는 코드들의 조각으로 구성됩니다. 이미지 인식과 같은 작업을 배우기 위해 AI 네트워크는 레이블이 지정된 이미지를 연구하고 네트워크의 각 인공 뉴런이 특정 패턴을 인식하는 전문 지식을 갖게 됩니다. 그러나 그들이 전문화하더라도 일반적인 네트워크의 모든 뉴런은 들어오는 모든 정보를 계속 받아들이고 분석합니다. 예를 들어 네트워크가 식물 사진을 볼 때 트럭을 인지하는 뉴런도 주의를 기울입니다. 그것은 불필요하게 시간과 에너지를 소비한다고 Shrivastava는 말합니다대학원에서 Shrivastava는 각 입력과 가장 관련있는 뉴런만 구분하고 활성화하는 방법을 찾았습니다. 그는 Dewey Decimal System이 도서관에서 책을 정리하는 것과 같이 데이터베이스에서 레코드를 정리하는 해시 함수를 사용했습니다. Shrivastava는 주어진 입력 값에 대한 관련성을 기반으로 네트워크에서 가상 뉴런을 구성하고 신속하게 찾기 위해 해시 함수 세트를 만들었습니다. 따라서 모든 식물 뉴런을 찾고 트럭 뉴런을 무시할 수 있습니다그는 2년 이상이 문제에 대해 생각하고 있었습니다. 당신은 당신의 모든 어려운 문제를 머리 뒤쪽에 보관합니다. 그는 시간이 있을 때 이것으로 돌아왔고 아무데도 가지 못했습니다. 그러나 대답의 길이 그에게 왔던 날, 그는 몇 시간 만에 그것을 해결했습니다. 그는 침실에 앉아 자신의 방법이 실제로 효과가 있을 것이라고 확신하기 위해 자신의 해결책을 읽고 다시 읽었던 것을 회상합니다. Rice의 컴퓨터 과학자인 Moshe Vardi는 그가 고안한 시스템은 "그해 최고의 기계 학습 연구"로 간주 될 수 있다고 말합니다. 2014 년 신경 정보 처리 시스템 컨퍼런스에서 우수 논문상을 수상했습니다그 이후로 Shrivastava는 표준 네트워크만큼 잘 작동하지만 95% 더 적은 계산을 사용하는 이미지 분류 신경망을 구축했습니다. 이러한 효율성은 AI 프로그램이 음성 인식을 위한 오디오와 같은 다른 정보를 처리 할 시간과 에너지를 확보하여보다 다양한 인공 지능을 위한 길을 닦을 수 있습니다. 그는 또한 2015 Rice 교수진에 합류 한 이후로 계산을 간소화하는 다른 방법을 개발했습니다. 그는놀랍도록 밝고 믿을 수 없을 정도로 빠릅니다.”라고 Vardi는 말합니다. RiceDuke UniversityShrivastava와 동료들은 최근 시리아 내전 피해자의 데이터베이스에 해싱을 적용 했습니다. 반인도적 범죄를 저지른 가해자를 기소하기 위해 시리아 분쟁의 정확한 사망 수를 파악하는 것은 매우 어려운 일이었습니다. 가족 구성원, 미디어 및 기타 출처가보고 한 피해자 데이터베이스에는 중복 기록이 포함되어 있습니다. 반복되는 값을 찾기 위해 354,000개의 모든 레코드를 서로 비교하려면 컴퓨터로 처리하더라도 일주일 이상의 시간이 소요됩니다. Shrivastava의 컴퓨터 프로그램이 4개의 피해자 데이터베이스에 있는 각 레코드에 해시 코드를 할당하면이 코드를 사용하여 단 몇 분 만에 중복 가능성이 있는 항목을 식별했습니다. 6월에 응용 통계 연보에 보고된 이 프로그램 은 해당 기록만 일치하는지 확인했습니다집에 더 가까워진 Shrivastava와 동료들은 사람의 주변 사진을 기반으로 쇼핑몰이나 기타 대형 건물을 탐색 할 수 있는 스마트 폰 앱을 만들었습니다. 이 앱은 사용자가 찍은 사진을 해시 코드로 추출하여 참조, 사진 코드와 비교하여 2초 이내에 위치를 알아냈습니다. 빅 데이터의 홍수가 증가함에 따라 Shrivastava가 좌절하기 쉽지만 다행히도 그는 포기하지 않았습니다. Shrivastava는 해시 기반의 유레카 순간으로 이어지는 일종의 뇌 폭발을 일으키기 전에 특정 문제에 대해 몇 달 또는 몇 년 동안 멈출 수 있습니다. 그러나 그가 느리게 움직이는 컴퓨터 시스템을 고속화 할 수 있을 때 그는 그만한 가치가 있다고 말합니다.