Phần mềm mới do Microsoft và Viện Công nghệ Technion-Israel phát triển, thu thập thông tin từ các bài báo tư liệu và các nguồn dữ liệu khác để dự đoán các sự kiện diễn ra trong tương lai.
Phầm mềm xem xét các tư liệu từ báo The New York Times và các nghiên cứu liên quan đến dữ liệu có trên Internet để đưa ra các dự báo về những sự kiện sắp diễn ra ở một số nơi trên thế giới như dịch bệnh, bạo động và số lượng lớn các ca tử vong.
Các nguồn của hệ thống bao gồm tư liệu của tờ The New York Timestừ năm 1986-2007, DBpedia (thông tin trong Wikipedia được thu thập từ nhiều nguồn khác nhau), WordNet (giúp phần mềm hiểu những từ có nghĩa) và OpenCyc (cung cấp cơ sở dữ liệu về kiến thức chung).
Hệ thống phải nghiên cứu các báo cáo, sau đó sử dụng các dữ liệu bên ngoài. Ví dụ, hệ thống xem xét các báo cáo về hạn hán ở Angola năm 2006. Nhờ nghiên cứu dữ liệu trên Web, hệ thống biết rằng hạn hạn có thể dẫn đến bùng phát dịch tả trong quốc gia này. Hệ thống nghiên cứu thêm vị trí của đất nước, mật độ dân số, GDP, tỷ lệ đất được bao phủ bởi nước…
Sau khi thu thập thông tin và nghiên cứu báo cáo khác từ The New York Times cho biết có những cơn bão lớn ở Angola vào đầu năm 2007, hệ thống đã dự báo sự bùng phát bệnh dịch tả. Gần 1 tuần sau đó, các báo cáo về bệnh dịch này đã xuất hiện.
Khi thử nghiệm phần mềm mới, các nhà nghiên cứu đã phát hiện thấy mức độ chính xác dao động từ 70-90%. Nhóm nghiên cứu cho rằng phần mềm có thể sử dụng một số nghiên cứu bổ sung để tăng độ chính xác, nhưng một khi đã hoàn thiện, hệ thống có thể giúp các tổ chức giải quyết các vấn đề trên thế giới.
Mặc dù một số công cụ dự báo đã được sử dụng, nhưng phần mềm này đặc biệt vì sử dụng tổng số 90 nguồn dữ liệu.