为确定特定字符串是否属于某个地理位置,我们做了哪些工作?例如:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'

我想我有点期待的是一种统计方法,可以确信前两个是位置。最后一个可能需要一种能够获得“%s,%s”的启发式算法。然后使用相同的技术。我特意寻找那些不太依赖命题'in'的方法,因为它不是一个完全明确或一致的位置指示器。

有人能指出方法,文件或现有的公用事业吗?谢谢!

有帮助吗?

解决方案

您描述的问题通常称为地理查询解析或更一般地称为地理信息检索。

最近有一项任务是在CLEF 2007上做这件事( http: //www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm )。获胜团队使用基于规则的语法,这类似于您可能不想要的语法。 www2009上的另一篇论文讨论了GeoParser: http://www2009.eprints.org/239/ 。 / p>

在CIKM 2007上还有一些关于地理信息检索的论文: http: //www.geo.unizh.ch/~rsp/gir07/accepted.html

我不知道有任何开源软件可以做到这一点,但它可能会捆绑到像Lemur这样的搜索引擎中。

其他提示

Everyblock.com采用了一种非常有趣的方法,专注于如何用英语表达位置 - 它们基本上使用了一些现在开源的复杂而广泛的正则表达式。他们的应用程序旨在扫描新闻文章,评论和各种公共数据源,并将它们与特定位置相关联,并且运行良好。表达如“20号东北角的建筑物中的火灾和旧金山的瓦伦西亚街”中的表达。非常准确地进行地理编码。您可以在此处查看来源。您可能需要的特定部分是位于 ebpub 下载中的 ebpub / ebpub / geocoder / base.py ,以及它周围的所有内容,例如从SmartGeocoder类开始,向后工作。

帮助链接: geonames.org search

  

返回为其找到的名称   searchterm为xml或json文档

示例: http://ws.geonames.org/search? q =特洛伊,%20ny&安培; maxRows进行= 10

我正在 geocode.xyz 建立一个免费的地理分析者

(目前支持约50个欧洲国家,很快将提供全球覆盖)

地理分析的示例应用可在 OpenWikiMap 上找到

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top