Merge pull request #27 from pks/master

Tidying (soft) syntax features; loo for C++ extractor; updates for dtrain
author: Chris Dyer <redpony@gmail.com> 2013-11-13 11:22:24 -0800
committer: Chris Dyer <redpony@gmail.com> 2013-11-13 11:22:24 -0800
commit: 9be8d89b5a4065a81b26d8af1f3443d152e7922a (patch)
tree: 237090ff519a0419c3ba379ec3a6884f05caa6c2 /extractor/grammar_extractor.cc
parent: 8a24bb77bc2e9fd17a6f6529a2942cde96a6af49 (diff)
parent: 4a9449a564e626fe004200b730bfaa44d6152e0f (diff)
1 files changed, 4 insertions, 2 deletions
diff --git a/extractor/grammar_extractor.cc b/extractor/grammar_extractor.cc
index 8050ce7b..1fbdee5b 100644
--- a/extractor/grammar_extractor.cc
+++ b/extractor/grammar_extractor.cc
@@ -3,11 +3,13 @@
 #include <iterator>
 #include <sstream>
 #include <vector>
+#include <unordered_set>
 
 #include "grammar.h"
 #include "rule.h"
 #include "rule_factory.h"
 #include "vocabulary.h"
+#include "data_array.h"
 
 using namespace std;
 
@@ -32,10 +34,10 @@ GrammarExtractor::GrammarExtractor(
     vocabulary(vocabulary),
     rule_factory(rule_factory) {}
 
-Grammar GrammarExtractor::GetGrammar(const string& sentence) {
+Grammar GrammarExtractor::GetGrammar(const string& sentence, const unordered_set<int> blacklisted_sentence_ids, const shared_ptr<DataArray> source_data_array) {
   vector<string> words = TokenizeSentence(sentence);
   vector<int> word_ids = AnnotateWords(words);
-  return rule_factory->GetGrammar(word_ids);
+  return rule_factory->GetGrammar(word_ids, blacklisted_sentence_ids, source_data_array);
 }
 
 vector<string> GrammarExtractor::TokenizeSentence(const string& sentence) {
author	Chris Dyer <redpony@gmail.com>	2013-11-13 11:22:24 -0800
committer	Chris Dyer <redpony@gmail.com>	2013-11-13 11:22:24 -0800
commit	9be8d89b5a4065a81b26d8af1f3443d152e7922a (patch)
tree	237090ff519a0419c3ba379ec3a6884f05caa6c2 /extractor/grammar_extractor.cc
parent	8a24bb77bc2e9fd17a6f6529a2942cde96a6af49 (diff)
parent	4a9449a564e626fe004200b730bfaa44d6152e0f (diff)