작성: EVAN ARMSTRONG 편집: Cointime.com QD
원장을 사용해보십시오
회계사는 오랫동안 인공 지능을 사용해 왔으며 인공 지능에 어떤 기술 이름을 부여하는지에 따라 다릅니다. 대규모 회계 회사는 때때로 기계 학습 모델을 사용하여 위험을 분류합니다. 그러나 GPT-4 및 Claude와 같은 대규모 언어 모델(LLM)은 아직 비교적 새롭기 때문에 이러한 기술은 아직 감사자 또는 회계사의 작업 흐름에 광범위하게 통합되지 않았습니다.
"회계사를 터미네이터 로봇으로 교체하고 싶습니다"라고 말하면 LLM을 사용하여 회계사가 일반적으로 수행하는 작업을 자동화할 방법을 찾고 있습니다.
내 Skynet 여정은 간단하게 시작되었습니다.
일정 기간 동안의 모든 차변과 대출이 나열된 스프레드시트인 Every Company의 원장을 ChatGPT에 업로드했습니다. 내 목표는 감사 회사가 수행하는 일련의 테스트를 실행하는 것입니다. 이상한 거래를 찾고 비즈니스 상태를 확인하는 등의 작업입니다. 이러한 테스트는 추상적이지만 비즈니스 상태에 대한 전반적인 그림을 제공하는 작은 분석입니다.
CSV 파일이 업로드되면 시스템이 작동하기 시작합니다. 이 CSV 파일이 원장이라는 것을 깨닫고 스스로 읽을 수 있는 5개의 코드 블록을 작성합니다.
참고: 은행 계좌 정보를 노출하고 싶지 않았기 때문에 이미지 크기에 대해 약간 창의적이었습니다. 사진은 모두 보충용이며 이 기사를 읽는 데 필요하지 않습니다.
데이터를 분류하고 약 10초 안에 질문할 준비가 되었습니다. 반대로 회계사는 이메일을 받는 데 일반적으로 24시간이 걸립니다.
다음으로, 나는 감사인이 할 몇 가지 작은 테스트를 통해 AI를 넣었습니다. 먼저 매주 볼륨을 보여주는 그래프를 생성하도록 요청합니다. 감사자는 이 분석을 간단한 위험 테스트로 수행하며, 비정상적으로 볼륨이 높은 주가 있는 경우 추가 확인을 원할 것입니다.
약 10초 만에 금융 전문가가 피벗 테이블과 차트 작성 도구를 사용하여 차트를 그릴 수 있는 것보다 빠르게 차트를 만들었습니다.
약 10초 만에 금융 전문가가 피벗 테이블과 차트 작성 도구를 사용하여 차트를 그릴 수 있는 것보다 빠르게 차트를 만들었습니다.
멋지지만 놀랍지는 않습니다. 한 단계 더 나아가 보겠습니다.
다음으로 지식을 테스트하기로 결정했습니다. 감사/회계사의 역할은 비즈니스가 얼마나 안전한지 결정하는 것입니다. 이를 위해 그들은 일반적으로 회사가 예상치 못한 청구서를 얼마나 빨리 충족할 수 있는지 측정하는 산성 테스트 비율과 같은 평가를 사용합니다. 요점은 원장을 사용하여 이 비율을 측정할 수 없다는 것입니다. 원장이 청구서를 지불하는 데 필요한 자산의 유동성을 알려줄 수 없기 때문에 대차대조표가 필요합니다. 고맙게도 AI는 톡톡 튀는 퀴즈를 멋지게 통과했습니다.
이 테스트는 원장에서 수행할 수 없지만 대차 대조표가 필요하다는 것을 알고 있습니다. 이 테스트를 수행한다면 약간 다른 버전의 공식을 사용하는 경향이 있지만 여전히 중요한 사항을 올바르게 가져옵니다. (우리 투자자들에게 주의를 기울이십시오. 당황하지 마십시오. 저는 이 공식을 직접 실행했으며 아직 파산하지 않았습니다.)
다음으로 AI가 원장에 대해 수행할 수 있는 작업인 데이터 품질 검사를 시도하겠습니다. 저는 일반 인간처럼 "Yo, 데이터는 어때?"라고 물으며 대화를 시도했습니다. 데이터를 테스트하는 5가지 다른 방법을 제공했습니다. 개인 정보 보호를 위해 처음 4개는 표시할 수 없습니다. 그러나 각각의 경우에 분석이 정확합니다. 관심 있는 분들을 위해 우리는 이미 감사자가 AI로 자동화할 6가지 작업을 수행했지만 마지막 데이터 테스트가 되어서야 실험에서 눈에 띄는 첫 번째 오류를 발견했습니다. "평균에서 3 표준 편차 이상"인 13개의 이상값을 찾았습니다.
나는 그것이 이 13가지 이유를 나열하게 했다. 실제로 이상값은 없으며 시스템에서 비용으로 간주하는 모든 열 또는 행 합계입니다. 요컨대, AI는 형식화로 인해 방해를 받습니다.
시스템이 망가진 것은 데이터 때문이 아니라 데이터에 레이블을 지정하는 방식이 혼란스러워졌기 때문입니다. 이것은 동시에 세계에서 가장 똑똑하고 멍청한 인턴입니다. 당신은 그것을 주시해야합니다. 우리는 스프레드시트를 만들 때 눈금선을 제거하거나 중요한 숫자를 굵게 표시하는 등 읽기 쉽게 만드는 작업을 하는 경우가 많습니다. 제품에서 이런 일이 발생하려면 문서를 기계가 읽을 수 있어야 합니다. 놀랍게도, 데이터가 분명히 AI를 위한 것이 아님에도 불구하고 시스템은 이를 수행할 수 있었습니다.
AI에게 실수했다고 알려주고, 사과하고, 함께 시트를 직접 수정해서 다시 올려 수정했습니다.
그러다가 또 까먹었습니다. 동일한 채팅에 P&L을 업로드하고 ChatGPT에 트랜잭션 수준 데이터를 월별 집계 실적과 비교하여 조정하도록 요청했습니다.
무너지는 것들
좋은 소식: AI는 동시에 여러 파일을 분석할 수 있습니다. 원장의 월별 비용을 손익계산서와 성공적으로 비교할 수 있었습니다. 나쁜 소식: 결과가 잘못되었습니다.
포맷 오류가 다시 발생합니다. 스프레드시트만으로는 AI가 서식을 파악하기 어렵습니다. 서식 스타일이 매우 다른 두 개의 스프레드시트를 추가하면 시스템이 중단됩니다. 파일을 읽을 수 있는 형식으로 다시 포맷하려고 했지만 오류가 쌓이기 시작했습니다. 해커와의 논의를 바탕으로 행의 헤더와 열의 헤더와 관련이 있다고 생각하지만 추가 실험이 필요합니다. Code Interpreter는 단일 파일에 대한 분석을 쉽게 수행할 수 있지만 확인해야 할 파일이 많을수록 더 어려워집니다.
나는 서론에서 내가 말한 것을 여전히 지지합니다. 인공 지능이 일부 지식 근로자를 대체할 수 있다고 생각합니다. 쉽게 풀 수 있는 문제들입니다. 총계정원장과 손익계산서를 동일한 형식으로 재설계하고 Stripe API를 사용하여 데이터베이스에 로드하고 완전히 자동화된 회계사의 이점을 누리십시오.
그런 다음 Code Interpreter를 사용하여 현금 흐름 할인 등과 같은 이러한 모든 기준에 대한 재무 분석을 수행 할 수 있으며 이제 자동화된 재무 부서가 있습니다. 모든 작업을 수행하지는 않지만 작업의 90%를 수행합니다. 나머지 10%의 직업은 재무 분석가보다 데이터 엔지니어의 직업에 더 가깝습니다.
솔직히 이것은 500억 달러의 기회입니다. 이 제품을 보유한 회사는 회계 및 재무 분야에서 지배적인 도구가 될 수 있는 기회를 갖게 될 것입니다. QuickBooks 또는 Oracle을 이길 수 있습니다. 누군가는 해야 합니다. 기술이 여기에 있습니다.
핵심 질문은 OpenAI가 코드 해석기를 노출하는 방법입니다. ChatGPT의 플러그인이라면 신생 기업은 신경 쓰지 않을 것입니다. 그러나 회사가 API(애플리케이션 프로그래밍 인터페이스)를 통해 이를 공개하면 실질적인 중단 가능성이 있습니다. 신생 기업은 판매 데이터의 파이프라인 및 형식에 대해 많은 작업을 수행할 수 있습니다. 멀티플레이어 또는 싱글 사인온과 같은 기능을 추가하는 것만으로도 스타트업의 존재를 정당화하기에 충분합니다. 내 인생을 싫어하지 않는 사람으로서 나는 B2B 소프트웨어를 판매하지 않으므로 이 아이디어를 자유롭게 사용하십시오(컨설턴트 수표를 보내주세요).
멋진 실험이지만 더 큰 의미가 있다고 생각합니다.
미래는 생각보다 낯설지도 몰라
AI 구축의 가장 큰 과제 중 하나는 수익 풀이 어떻게 축적되는지 이해하는 것입니다.
이 실험 전에는 항상 기존 워크플로 또는 독점 데이터 세트에 AI 기능을 추가하는 기존 회사에 가치가 주로 발생한다고 믿었습니다. 지금까지는 팩트가 증명했다. Microsoft는 규모 면에서 AI 분야의 분명한 선두주자이며 회사는 둔화될 조짐을 보이지 않습니다.
그러나 이 총계정 원장 연습은 단순한 회계 그 이상입니다. 인공 지능이 전체 생산성 세계를 어떻게 혼란에 빠뜨릴 것인지에 대한 눈을 뜨게 되었습니다. AI는 기존 기업이 이 새로운 미래로 전환할 수 없도록 근본적으로 작업 프로세스를 재정의할 수 있는 잠재력을 가지고 있습니다. 스타트업은 실제로 거인을 따라잡을 기회가 있습니다.
농담조로 나는 바보야, 나는 기술을 이해하지 못하고, 생계를 위해 논문을 쓴다고 말했다. 그래도 대부분의 감사 업무를 자동화할 수 있었습니다. 재능 있는 팀이 제품화하면 어떻게 될까요?
농담조로 나는 바보야, 나는 기술을 이해하지 못하고, 생계를 위해 논문을 쓴다고 말했다. 그래도 대부분의 감사 업무를 자동화할 수 있었습니다. 재능 있는 팀이 제품화하면 어떻게 될까요?
모든 생산성 작업은 데이터를 가져와 출력으로 전환하는 것입니다. Code Interpreter는 입력이 산문에서 원시 데이터로 변경되었기 때문에 이전 AI 시스템에 비해 크게 개선되었습니다. 이 도구는 마음 자체에 대한 추상화 계층입니다. 금융 도구가 아니라 추론 도구, 사고 도구입니다. 릴리스 발표에서 OpenAI는 금융 사용 사례도 언급하지 않았습니다! 우리에게는 작업을 재창조할 수 있는 많은 기회가 있습니다. Code Interpreter는 고급 API 또는 데이터베이스에 액세스할 필요조차 없음을 의미합니다. OpenAI가 사용하기로 결정하면 명령 모음과 파일만 있으면 됩니다.
지난 1년 동안 나는 인공지능이 노동을 재편한다는 생각을 여러 번 들었다. 하지만 이 도구를 통해 구현되는 것을 처음 보았습니다. 결점이나 문제가 없는 것은 아니지만 다가오고 있습니다. 설레고, 무섭고, 무섭고, 짜릿하고, 멋지고, 무섭고, 6개월도 채 안된 알파 제품일 뿐입니다. 모델의 다음 버전은 어떻습니까? 아니면 다른 회사에서는 어떤 제품을 출시할까요?
이것은 먼 문제가 아니라 18개월 후에 직면해야 할 문제입니다.
OpenAI의 가장 큰 경쟁자인 Anthropic은 지난 6개월 동안 가장 많이 본 뉴스 기사 중 하나에서 안내서를 유출했습니다 . 한 버전의 보고서에 따르면 회사는 GPT-4보다 10배 더 강력한 "Claude-Next"를 구축하기 위해 10억 달러를 원한다고 합니다. 여러 출처에서 이 체계의 다른 버전이 GPT-4보다 50배 개선되었다고 주장하는 것을 확인했습니다.
그 생각을 계속해서 가라앉히고 싹트게 놔두세요. Code Interpreter보다 50배 더 똑똑한 시스템이 지식 노동에 의미하는 바는 무엇입니까? OpenAI가 유사한 확장 기능에 대해 논의하고 있다고 들었습니다.
이 회사가 해낼 수 있을지 누가 알겠습니까? 하지만 2년 안에 오늘날보다 50배 더 나은 모델을 갖게 될 것이라고 상상할 수 있습니까? 예, 이것은 빌보드 주장이며 완전히 신뢰할 수 없지만 사실이라면 어떻게 될까요? 축소된 10배 개선 모델도 상상할 수 없는 가능성의 세계를 열어줍니다.
이것은 지식 노동의 완전한 재창조를 의미할 것입니다. 이것은 신생 기업이 거인을 이길 기회가 있음을 의미합니다. Anthropic은 홍보 자료에서 "이러한 모델은 경제의 많은 부분을 자동화하기 시작할 수 있습니다.
이 실험은 나에게 미래를 엿볼 수 있게 해주었고, 여러분이 준비되길 바랍니다.
모든 댓글