Скачать текущий прайм-рейт WSJ.com
Вопрос
Мне нужно автоматически загрузить текущий прайм-рейт Wall Street Journal и загрузить данные в мою базу данных.Каков наилучший способ автоматической загрузки этих данных?
Я придумал три возможных решения для этого:
- Очистите веб-страницу HTML от WSJ.
- Разберите новостную ленту RSS от WSJ.
- Используйте какой-нибудь API, которого я не нашел в WSJ.
Что касается решения 1, хотя решение 1 мне не нравится, поскольку оно может легко сломаться, оно единственное, которое я разработал от начала до конца.Кажется, я могу поцарапать эта страница с помощью WebRequest/WebResponse и прочитайте текст в этом коде:
<tr>
<td style="text-align:left" class="colhead"> </td>
<td class="colhead">Latest</td>
<td class="colhead">Wk ago</td>
<td class="colhead">High</td>
<td class="colhead">Low</td>
</tr>
<tr>
<td class="text">U.S.</td>
<td style="font-weight:bold;" class="num">3.25</td>
<td class="num">3.25</td>
<td class="num">3.25</td>
<td class="num" style="border-right:0px">3.25</td>
</tr>
Что касается решения 2, хотя я могу реализовать решение для чтения RSS, я не вижу способа надежно предвидеть многословие об изменениях основной ставки.Поэтому я не думаю, что это такой же безопасный и надежный способ получения данных, как решение 1.
Что касается решения 3, я не нашел ни одного опубликованного API для проверки денежных ставок, таких как Prime Rate.Если кто-нибудь знает веб-сервис или другой API для проверки денежных курсов, дайте мне знать.
Решение
Я реализовал следующий код для очистки HTML и обработки результатов:
Задача сценария C# пакета SSIS
public void Main()
{
// Post the web page.
try
{
// Set variables.
bool fireAgain = true;
Uri WebPageURI = new Uri("http://online.wsj.com/mdc/public/page/2_3020-moneyrate.html");
// Post the web page.
WebRequest request = WebRequest.Create(WebPageURI);
request.Timeout = (1000 * 60 * 60);
request.Method = "POST";
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream());
string Output = reader.ReadToEnd();
Dts.Variables["wall_street_journal_str"].Value = Output;
Dts.Events.FireInformation(0, "WebRequest:", WebPageURI.ToString(), "", 0, ref fireAgain);
Dts.Events.FireInformation(0, "WebResponse:", Output, "", 0, ref fireAgain);
}
catch (WebException ex)
{
Dts.Events.FireError(0, "Error:", ex.Message, "", 0);
}
// Return success.
Dts.TaskResult = (int)ScriptResults.Success;
}
Хранимая процедура, вызываемая задачей «Выполнение SQL»
SET @WALL_STREET_JOURNAL_HTML = SUBSTRING(@WALL_STREET_JOURNAL_HTML, CHARINDEX('Prime rates', @WALL_STREET_JOURNAL_HTML, 1), CHARINDEX('Canada', @WALL_STREET_JOURNAL_HTML, CHARINDEX('Prime rates', @WALL_STREET_JOURNAL_HTML, 1)) - CHARINDEX('Prime rates', @WALL_STREET_JOURNAL_HTML, 1))
SELECT @RATE_CHANGE_DATE = CONVERT(DATE, RTRIM(LTRIM(SUBSTRING(@WALL_STREET_JOURNAL_HTML, CHARINDEX('[', @WALL_STREET_JOURNAL_HTML, 1) + 23, CHARINDEX(']', @WALL_STREET_JOURNAL_HTML, 1) - CHARINDEX('[', @WALL_STREET_JOURNAL_HTML, 1) - 23))))
, @RATE = CONVERT(NUMERIC(8, 2), SUBSTRING(@WALL_STREET_JOURNAL_HTML, CHARINDEX('class="num">', @WALL_STREET_JOURNAL_HTML, CHARINDEX('U.S.</td>', @WALL_STREET_JOURNAL_HTML, 1)) + 12, CHARINDEX('<', @WALL_STREET_JOURNAL_HTML, CHARINDEX('class="num">', @WALL_STREET_JOURNAL_HTML, CHARINDEX('U.S.</td>', @WALL_STREET_JOURNAL_HTML, 1))) - CHARINDEX('class="num">', @WALL_STREET_JOURNAL_HTML, CHARINDEX('U.S.</td>', @WALL_STREET_JOURNAL_HTML, 1)) -12))
Уродливый код, но он служит цели.Существует также несколько правил проверки, которые используются для проверки правильности данных, но это основная часть того, что я использовал для очистки значения.
Другие советы
Для этого есть WebService, но это не стоит стоимости, если все, что вы хотите, является основным ставком:
Мне около 5 лет, но подумали, что приведу это.Преступник Имеет хороший API для получения этой информации.