닐 암스트롱을 달 표면 위에 올려놓기 위해 미국 항공우주국은 수천 개의 변수를 엄밀한 정확도로 계산해야 했습니다. 변수 단 하나의 누락 혹은 연산 중간의 반올림 실수는 우주인의 목숨과 수 조원의
예산을 잃는 것과 등가였습니다.
입시 역시 마찬가지입니다. 하나의 변수, 파라미터, 제약 조건을 놓치는 것은 합격의 기회를 잃는 것과 등가입니다.
최근 수 년 간 급진전한 기계학습적 지식과 실질적으로 모든 상위권 수험생이 거쳐가며 데이터를 내뿜는 오르비라는 강력한 플랫폼 덕택에 우리는 불과 몇 년 전이라면 얻을 수 없었던 양의 데이터를
얻고, 불과 몇 년 전이라면 할 수 없었던 분량의 계산을 할 수 있게 되었습니다. 우리가 한 장의
보고서를 내기 위해 들이는 연산량은 인간을 달 표면에
안착시키기 위해 들였던 연산량보다 더 많습니다.
종종 사람들은 “
에서 60% 합격 가능하다는 것이 무슨 의미인가요?” 라고 묻습니다. 거기에 대한 우리의 답은 “60% 합격 가능하다는 뜻입니다.”입니다. 잘 이해를
못하시면 다시 표현합니다. “40% 불합격 가능하다는 뜻입니다.”
우리는 약 600개 학과에 대해 추정을 합니다. 그 600개 학과에 “60% 합격 가능한 점수”로 지원을 하면, 600 x 60% = 360개 학과에 최종 추가합격할 수 있습니다.
반면 이렇게 횡단면분석을 하지 않고 시계열분석을 할 수도 있죠. 특정한 학과에 대해 “60% 합격 가능한 점수”로 10년 간 꾸준히 지원을 하면 10 x 60% = 6년은 최종 추가합격할 것이고,
4년은 불합격할 것입니다.
우리는 “안정지원”, “소신지원”이라는 표현을 쓰지 않고 “100%”, “50%”라는 표현을 사용합니다. 어떤 것이 안정적인 것인지에 대한 생각은 사람마다 다릅니다. 입시전문가가
말한 “안정”의 의미와 학부모가 받아들이는 “안정”의 의미는 서로 다를 수 있습니다. 반면 우리의 표현과 분석은 명쾌하고, 솔직하며, 검증 가능하고, 정확합니다. 우리가 50%라고 하면 정말 절반의
확률로 그 사건이 발생합니다. 우리의 추정은 미신이 아니라 과학입니다. 수학입니다. 귀하는 그 확률, 그 리스크를 택할지 버릴지만 결정하면 됩니다.
어떤 입시 수요자들은 더 좋은 대학, 더 좋은 학과에 합격하기 위해 기꺼이 계산된 리스크를 감수합니다. 반면 어떤 수요자들은 합격에 대한 “확신”을 필요로 합니다. 우리는 그 요청에 답하고자
하였습니다. 그렇게 생겨난 것이
의
입니다.
가 켜진 학과에 지원할
경우
는 100% 합격을 보장합니다.
지난 4년 간 우리는 1,823개 학과에 대해
추정을 하였습니다. 그리고 그 중 1,821개 학과에 합격 가능했습니다. 다시 말해, 지난
4년 간
가 켜진 학과에 지원했을 때 합격 가능할 확률은 실제로 99.9%였습니다.
물론 “
”에 해당하는 점수로 만점이나 다름 없는, 터무니 없이 높은 점수를 제시했다면 쉽게 100%의 확률을 얻을 수 있었을 것입니다.
하지만 우리는 그렇게 하지 않았습니다. 매우 현실적인 점수를 제시하였습니다. 적지 않은 사람들이 과연 그 점수가 “무조건적인 합격”을 말할 수 있는 점수인지 의심했습니다. 어떤 의미에서는,
“
” 가 적중하지 않은 0.1%의 사례가 그런 현실성에 대한 반증이기도 합니다.
우리는 어떤 대학, 어떤 학과에서 폭발이 일어날 것인지는 정확히 예견하지 못합니다. 하지만 어떤 학과에서 일어나는 우발적인 사건이, 그 학과와 연결되어 있는 수없이 많은 모든
학과에 영향을 준다는 것을 알고 있습니다. 모든 대학의 모든 학과에서 폭발이 일어날 수는 없습니다. 모든 대학의 모든 학과에서 입시 기관의 예상처럼 질서정연한 커트라인이 형성되지도 않습니다. 현실은
한없이 불확실하고 혼란스러운 요동입니다. 우리는 그 불확실성, 혼란스러움이 정확히 어느 정도인지 측정하고, 어느 정도까지 늘 어날 수 있는지를 연산했습니다. 그리고 다른 모든 사람들에게는 불안하게
보이지만 우리에게 “발견”되는 그 지점에 “
”의 깃발을 꽂았습니다.
입시 현장에는 불신과 증오가 팽배합니다. 어쩔 수 없이 발생하게 마련인 불운한 확률의 희생자는, 모습을 감춘 전문가들을 저주합니다. 전문가들은 상담의 결과에 책임을 지지 않아왔습니다.
하지만 우리는 지금까지 그 어떤 입시 기관도 감히 하지 못했던 보장을 드리려 합니다. 우리는 이런 식으로 추정의 결과에 책임을 지고 있습니다:
하나, 최종판의 “
” 점수에서 지원을 했음에도 불구하고 최종 탈락할 경우 해당 구입 금액의 1000%(10배)를 현금으로 보상해 드리고 있습니다. *
둘, 최종판의 가, 나, 다군** 모두에서 합격 확률 67% 이상으로 예견되었음에도 불구하고 모두 최종 불합격할 경우, 모든 구매 금액을 환불해 드릴 것입니다.
이것은 교만이 아닙니다. 결코 그러한 일들이 발생해선 안 된다고 주문을 외우는 것도 아닙니다. 이것은 우리가 모든 고객들에게 결국 얼마를 보상하게 될지조차 확률로 정확히 예측이
가능하기 때문에 보일 수 있는 결연한 자신감입니다.
이 자신감은 어디로부터 오는 것일까요?
*자세한 환불 조건에 관해서는 EULA를 참조하십시오.
**가, 나, 다군 모두에서 가 지원하는 범위 내의 대학과 학과에 지원해야
합니다.
오르비는 정보의 중력장입니다. 무려 9만 건 이상의 상위 2% 이내 표본을 보유하고 있습니다. 전체 점수 대에 대한 표본으로는 450만 개의 표본을 가지고 있어야 확보 가능한 분량입니다. 우리는 인터넷 어디에든지 잠시라도 거쳐간, 실질적으로 모든 최상위권 표본을 흡수합니다. 귀하가 지원하고자 하는 그 대학 그 학과에 올해 2월 17일 오후 9시 마지막 전화를 받고 합격한 학생의 점수를 압니다. 그 학생이 합격, 불합격 사실을 공개하지 않는다면 그 학생의 앞뒤에 서있는 학생들의 점수를 확보해 업계에서 가장 많은 최상위권 지원 표본을 보유하고 있는 오르비 모의지원 표본 및 응답결과와 조합해 실제 커트라인을 아주 높은 가능성으로 추론해 냅니다. 10년 간 축적된 45만 개 이상의 대학AH 응답 결과를 통해, 두 개의 서로 다른 학교와 학과에 합격 한 학생이 각각의 학과를 택할 가능성까지도 알고 있습니다.
사람이 잠든 시간에도 24시간 내내 수집되는 정보는, 각종 기계학습, 인공지능 도구를 이용해 24시간 내내 분 석됩니다. 이전까지는 인간의 뇌와 포도당이 표본을 분석하고, 허수 표본을 걸러냈습니다. 이제 그것은 GPU 와 전기의 몫입니다. 오르비를 거쳐가는 모든 표본은, 표본이 게시된 시점과 회선 정보 및 주소, 같은 주소에서 그동안 전송된 정보의 품질, 제출된 표본의 점수 구성과 과거 표본들 간의 벡터 연산 등을 고려해 신뢰도가 부 여됩니다. 높은 신뢰도를 가진 표본의 가중치(weight)는 높아지고, 낮은 신뢰도를 가진 표본의 가중치는 낮아 집니다. 가짜 표본을 제출한 사람에게는 (반복된 가짜 표본 제출로 인한 왜곡을 방지하기 위해) 가짜 표본이 여전히 보이지만 연산과정에서는 기각됩니다. PC 브라우저에서 제출된 국어 73, 수학 77, 영어 72, 탐구 38, 48 점 표본은 가중치가 급락합니다. 전형적인 허위 표본이기 때문입니다. (양손을 키보드 위에 올린 후 임의의 그 럴듯한 숫자를 입력하려 하면 손가락의 이동 거리가 짧은 이와 같은 점수 조합을 무의식중에 선호하게 됩니다.) 일단 허위 표본을 제출한 IP에서 향후 제출되는 정보는 가중치가 떨어져 충분한 시간이 경과하기 전까지는 실질적으로 모두 기각됩니다.
단지 많은 수의 표본만이 지금의 오르비를 가능하게 했던 것은 아닙니다. 얼마 전까지도 입시란 그것이 어느 방향으로 움직일지 도무지 예측할 수 없는 생물이었습니다. 진실을 찾기 위해 매일 밤을 새운 우리의 노력은 지난 18년 전까지 거슬러 올라갑니다. 그동안 축적된 모든 정보와 노하우는 수백 메가바이트의 코드 속에 상수로 정제되거나, 변수로 산입되거나, 공식으로 결정체를 이루었습니다.
2002년에도 이미 상당히 높은 정확도로 최상위권 대학의 합격선을 추정해냈습니다.
2003 수능 Cutraced
Report
그것은 단순히 주먹구구와 감으로 계산을 하지 않고 이런 연구를 했기 때문에 가능했습니다.
2003. 10. 대학수학능력시험 변환표준점수의 이해
대학이 입학사정에서 반영하는 수능 과목의 숫자가 적을 때 합격선이 올라가는 현상인 백분위 밀림 현상은 오르비가 처음으로 정의하고 설명하였으며, 그것은 탐구
영역 선택 과목제도가 실시되기도 전인 2003년 12월이 었습니다.
The Future
2005
2008학년도 서울대학교 법과대학이 마지막으로 신입생을 선발할 때 서울법대에서 발생할, 소위 “펑크”와 그 펑크의 정도까지 정확히
예측하였습니다.
2008학년도 서울대 정시 오르비 프래서지움 추정 정확도
2010년부터 이미 서울대 변환표준점수표를 거의 완벽하게 예측할 수 있는 노하우를 갖추고 있었습니다.
2011 수능 서울대 변환표준점수 공식 발표
2011년에는 최상위권 모든 학과의 합격자 표본을 1명 단위로 추적해서 60페이지 분량의 보고서를 냈습니다.
Fait Accompli 11 Review
오로지 과거에 발생했던 일들에 대한 정보만으로 미래를 예견할 수는 없습니다. 과거에 발생했던 일을 기억할 수 있는 지능, 그것을 적합한 방식으로 이해하고 소화하고 분석 할 수 있는 지식, 그리고 마침내 그로부터 발생할 수 있는 일을 예견할 수 있는 지혜의 조화로 우리는 미래를 볼 수 있습니다. 실리콘은 우리의 새로운 두뇌입니다. 우리가 수 집한 모든 정보는 무한한 연산능력의 클라우드 서버에서 귀하를 위해 새롭게 가공됩니다.