rewrite identifier as regular scanner
This commit is contained in:
parent
8fcd012702
commit
fc5a0fff47
8 changed files with 2058 additions and 883 deletions
|
@ -9,7 +9,6 @@
|
||||||
"sources": [
|
"sources": [
|
||||||
"bindings/node/binding.cc",
|
"bindings/node/binding.cc",
|
||||||
"src/parser.c",
|
"src/parser.c",
|
||||||
"src/scanner.c",
|
|
||||||
# If your language uses an external scanner, add it here.
|
# If your language uses an external scanner, add it here.
|
||||||
],
|
],
|
||||||
"cflags_c": [
|
"cflags_c": [
|
||||||
|
|
|
@ -1,3 +1,3 @@
|
||||||
Foo bar
|
Foo Bar -- Biz Baz
|
||||||
-Biz-baz-
|
-Bar-Foo- <- -Baz-Biz-
|
||||||
|
|
||||||
|
|
32
grammar.js
32
grammar.js
|
@ -1,8 +1,6 @@
|
||||||
module.exports = grammar({
|
module.exports = grammar({
|
||||||
name: "d2",
|
name: "d2",
|
||||||
|
|
||||||
externals: ($) => [$._identifier],
|
|
||||||
|
|
||||||
rules: {
|
rules: {
|
||||||
// TODO: add the actual grammar rules
|
// TODO: add the actual grammar rules
|
||||||
source_file: ($) => repeat($._definition),
|
source_file: ($) => repeat($._definition),
|
||||||
|
@ -35,12 +33,32 @@ module.exports = grammar({
|
||||||
|
|
||||||
identifier: ($) => $._identifier,
|
identifier: ($) => $._identifier,
|
||||||
|
|
||||||
arrow: ($) =>
|
_identifier: ($) =>
|
||||||
|
prec.right(
|
||||||
|
seq(
|
||||||
|
repeat(" "),
|
||||||
|
optional($._dash),
|
||||||
choice(
|
choice(
|
||||||
seq("--", repeat("-")),
|
$._word,
|
||||||
seq("<-", repeat("-")),
|
repeat1(seq($._word, choice(repeat(" "), $._dash), $._word))
|
||||||
seq("<-", repeat("-"), ">"),
|
),
|
||||||
seq(repeat("-"), "->")
|
optional($._dash),
|
||||||
|
repeat(" ")
|
||||||
|
)
|
||||||
|
),
|
||||||
|
|
||||||
|
_dash: ($) => token.immediate("-"),
|
||||||
|
|
||||||
|
_word: ($) => /[\w\d]+/,
|
||||||
|
|
||||||
|
arrow: ($) =>
|
||||||
|
prec.left(
|
||||||
|
choice(
|
||||||
|
seq("--", repeat($._dash)),
|
||||||
|
seq("<-", repeat($._dash)),
|
||||||
|
seq("<-", repeat($._dash), ">"),
|
||||||
|
seq(repeat($._dash), "->")
|
||||||
|
)
|
||||||
),
|
),
|
||||||
|
|
||||||
_unquoted_string: ($) => /[^\n;{]+/,
|
_unquoted_string: ($) => /[^\n;{]+/,
|
||||||
|
|
126
src/grammar.json
126
src/grammar.json
|
@ -170,7 +170,109 @@
|
||||||
"type": "SYMBOL",
|
"type": "SYMBOL",
|
||||||
"name": "_identifier"
|
"name": "_identifier"
|
||||||
},
|
},
|
||||||
|
"_identifier": {
|
||||||
|
"type": "PREC_RIGHT",
|
||||||
|
"value": 0,
|
||||||
|
"content": {
|
||||||
|
"type": "SEQ",
|
||||||
|
"members": [
|
||||||
|
{
|
||||||
|
"type": "REPEAT",
|
||||||
|
"content": {
|
||||||
|
"type": "STRING",
|
||||||
|
"value": " "
|
||||||
|
}
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "CHOICE",
|
||||||
|
"members": [
|
||||||
|
{
|
||||||
|
"type": "SYMBOL",
|
||||||
|
"name": "_dash"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "BLANK"
|
||||||
|
}
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "CHOICE",
|
||||||
|
"members": [
|
||||||
|
{
|
||||||
|
"type": "SYMBOL",
|
||||||
|
"name": "_word"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "REPEAT1",
|
||||||
|
"content": {
|
||||||
|
"type": "SEQ",
|
||||||
|
"members": [
|
||||||
|
{
|
||||||
|
"type": "SYMBOL",
|
||||||
|
"name": "_word"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "CHOICE",
|
||||||
|
"members": [
|
||||||
|
{
|
||||||
|
"type": "REPEAT",
|
||||||
|
"content": {
|
||||||
|
"type": "STRING",
|
||||||
|
"value": " "
|
||||||
|
}
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "SYMBOL",
|
||||||
|
"name": "_dash"
|
||||||
|
}
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "SYMBOL",
|
||||||
|
"name": "_word"
|
||||||
|
}
|
||||||
|
]
|
||||||
|
}
|
||||||
|
}
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "CHOICE",
|
||||||
|
"members": [
|
||||||
|
{
|
||||||
|
"type": "SYMBOL",
|
||||||
|
"name": "_dash"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "BLANK"
|
||||||
|
}
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"type": "REPEAT",
|
||||||
|
"content": {
|
||||||
|
"type": "STRING",
|
||||||
|
"value": " "
|
||||||
|
}
|
||||||
|
}
|
||||||
|
]
|
||||||
|
}
|
||||||
|
},
|
||||||
|
"_dash": {
|
||||||
|
"type": "IMMEDIATE_TOKEN",
|
||||||
|
"content": {
|
||||||
|
"type": "STRING",
|
||||||
|
"value": "-"
|
||||||
|
}
|
||||||
|
},
|
||||||
|
"_word": {
|
||||||
|
"type": "PATTERN",
|
||||||
|
"value": "[\\w\\d]+"
|
||||||
|
},
|
||||||
"arrow": {
|
"arrow": {
|
||||||
|
"type": "PREC_LEFT",
|
||||||
|
"value": 0,
|
||||||
|
"content": {
|
||||||
"type": "CHOICE",
|
"type": "CHOICE",
|
||||||
"members": [
|
"members": [
|
||||||
{
|
{
|
||||||
|
@ -183,8 +285,8 @@
|
||||||
{
|
{
|
||||||
"type": "REPEAT",
|
"type": "REPEAT",
|
||||||
"content": {
|
"content": {
|
||||||
"type": "STRING",
|
"type": "SYMBOL",
|
||||||
"value": "-"
|
"name": "_dash"
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
]
|
]
|
||||||
|
@ -199,8 +301,8 @@
|
||||||
{
|
{
|
||||||
"type": "REPEAT",
|
"type": "REPEAT",
|
||||||
"content": {
|
"content": {
|
||||||
"type": "STRING",
|
"type": "SYMBOL",
|
||||||
"value": "-"
|
"name": "_dash"
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
]
|
]
|
||||||
|
@ -215,8 +317,8 @@
|
||||||
{
|
{
|
||||||
"type": "REPEAT",
|
"type": "REPEAT",
|
||||||
"content": {
|
"content": {
|
||||||
"type": "STRING",
|
"type": "SYMBOL",
|
||||||
"value": "-"
|
"name": "_dash"
|
||||||
}
|
}
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
|
@ -231,8 +333,8 @@
|
||||||
{
|
{
|
||||||
"type": "REPEAT",
|
"type": "REPEAT",
|
||||||
"content": {
|
"content": {
|
||||||
"type": "STRING",
|
"type": "SYMBOL",
|
||||||
"value": "-"
|
"name": "_dash"
|
||||||
}
|
}
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
|
@ -242,6 +344,7 @@
|
||||||
]
|
]
|
||||||
}
|
}
|
||||||
]
|
]
|
||||||
|
}
|
||||||
},
|
},
|
||||||
"_unquoted_string": {
|
"_unquoted_string": {
|
||||||
"type": "PATTERN",
|
"type": "PATTERN",
|
||||||
|
@ -330,12 +433,7 @@
|
||||||
],
|
],
|
||||||
"conflicts": [],
|
"conflicts": [],
|
||||||
"precedences": [],
|
"precedences": [],
|
||||||
"externals": [
|
"externals": [],
|
||||||
{
|
|
||||||
"type": "SYMBOL",
|
|
||||||
"name": "_identifier"
|
|
||||||
}
|
|
||||||
],
|
|
||||||
"inline": [],
|
"inline": [],
|
||||||
"supertypes": []
|
"supertypes": []
|
||||||
}
|
}
|
||||||
|
|
|
@ -98,6 +98,10 @@
|
||||||
"type": "\n",
|
"type": "\n",
|
||||||
"named": false
|
"named": false
|
||||||
},
|
},
|
||||||
|
{
|
||||||
|
"type": " ",
|
||||||
|
"named": false
|
||||||
|
},
|
||||||
{
|
{
|
||||||
"type": "\"",
|
"type": "\"",
|
||||||
"named": false
|
"named": false
|
||||||
|
@ -106,10 +110,6 @@
|
||||||
"type": "'",
|
"type": "'",
|
||||||
"named": false
|
"named": false
|
||||||
},
|
},
|
||||||
{
|
|
||||||
"type": "-",
|
|
||||||
"named": false
|
|
||||||
},
|
|
||||||
{
|
{
|
||||||
"type": "--",
|
"type": "--",
|
||||||
"named": false
|
"named": false
|
||||||
|
|
2552
src/parser.c
2552
src/parser.c
File diff suppressed because it is too large
Load diff
|
@ -1,71 +0,0 @@
|
||||||
#include <tree_sitter/parser.h>
|
|
||||||
#include <wctype.h>
|
|
||||||
|
|
||||||
enum TokenType {
|
|
||||||
IDENTIFIER
|
|
||||||
};
|
|
||||||
|
|
||||||
void *tree_sitter_d2_external_scanner_create() { return NULL; }
|
|
||||||
void tree_sitter_d2_external_scanner_destroy(void *payload) { }
|
|
||||||
unsigned tree_sitter_d2_external_scanner_serialize(void *p, char *buffer) { return 0; }
|
|
||||||
void tree_sitter_d2_external_scanner_deserialize(void *p, const char *b, unsigned n) {}
|
|
||||||
|
|
||||||
static void advance(TSLexer *lexer) { lexer->advance(lexer, false); }
|
|
||||||
static void skip(TSLexer *lexer) { lexer->advance(lexer, true); }
|
|
||||||
|
|
||||||
static bool scan_identifier(TSLexer *lexer) {
|
|
||||||
lexer->result_symbol = IDENTIFIER;
|
|
||||||
while (iswspace(lexer->lookahead)) {
|
|
||||||
skip(lexer);
|
|
||||||
}
|
|
||||||
|
|
||||||
for (bool has_content = false;; has_content = true) {
|
|
||||||
lexer->mark_end(lexer);
|
|
||||||
|
|
||||||
for (;;) {
|
|
||||||
switch (lexer->lookahead) {
|
|
||||||
case '{':
|
|
||||||
case ':':
|
|
||||||
case ';':
|
|
||||||
case '<':
|
|
||||||
case '.':
|
|
||||||
case '\n':
|
|
||||||
case '\0':
|
|
||||||
return has_content;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (iswspace(lexer->lookahead)) {
|
|
||||||
advance(lexer);
|
|
||||||
} else {
|
|
||||||
break;
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
switch (lexer->lookahead) {
|
|
||||||
case '-':
|
|
||||||
advance(lexer);
|
|
||||||
switch (lexer->lookahead) {
|
|
||||||
case '-':
|
|
||||||
case '>':
|
|
||||||
return has_content;
|
|
||||||
}
|
|
||||||
break;
|
|
||||||
default:
|
|
||||||
advance(lexer);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
bool tree_sitter_d2_external_scanner_scan(
|
|
||||||
void *payload,
|
|
||||||
TSLexer *lexer,
|
|
||||||
const bool *valid_symbols
|
|
||||||
) {
|
|
||||||
if (valid_symbols[IDENTIFIER]) {
|
|
||||||
return scan_identifier(lexer);
|
|
||||||
}
|
|
||||||
|
|
||||||
return false;
|
|
||||||
}
|
|
||||||
|
|
||||||
|
|
|
@ -32,6 +32,41 @@ biz<-baz
|
||||||
)
|
)
|
||||||
)
|
)
|
||||||
|
|
||||||
|
==================
|
||||||
|
Formatted connection
|
||||||
|
==================
|
||||||
|
|
||||||
|
foo -- bar
|
||||||
|
biz -> baz
|
||||||
|
biz <-> baz
|
||||||
|
biz <- baz
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
(source_file
|
||||||
|
(connection
|
||||||
|
(identifier)
|
||||||
|
(arrow)
|
||||||
|
(identifier)
|
||||||
|
)
|
||||||
|
(connection
|
||||||
|
(identifier)
|
||||||
|
(arrow)
|
||||||
|
(identifier)
|
||||||
|
)
|
||||||
|
(connection
|
||||||
|
(identifier)
|
||||||
|
(arrow)
|
||||||
|
(identifier)
|
||||||
|
)
|
||||||
|
(connection
|
||||||
|
(identifier)
|
||||||
|
(arrow)
|
||||||
|
(identifier)
|
||||||
|
)
|
||||||
|
)
|
||||||
|
|
||||||
|
|
||||||
=============================
|
=============================
|
||||||
Complex identifier connection
|
Complex identifier connection
|
||||||
=============================
|
=============================
|
||||||
|
|
Loading…
Reference in a new issue