Riskoprofil trainingsdaten erweitert

pull/34/head
s8613 2025-04-24 14:06:49 +02:00
parent 7cf96232e9
commit 3f71189f66
15 changed files with 702 additions and 1045 deletions

File diff suppressed because it is too large Load Diff

View File

@ -46,7 +46,7 @@
"f":1.0 "f":1.0
} }
}, },
"tok2vec_loss":0.000000011, "tok2vec_loss":0.000000029,
"ner_loss":0.0000000457 "ner_loss":0.0000000614
} }
} }

View File

@ -1 +1 @@
ĄmovesŮx{"0":{},"1":{"RISIKOPROFIL":20},"2":{"RISIKOPROFIL":20},"3":{"RISIKOPROFIL":20},"4":{"RISIKOPROFIL":20,"":1},"5":{"":1}}Łcfg<66>§neg_keyŔ ĄmovesŮx{"0":{},"1":{"RISIKOPROFIL":45},"2":{"RISIKOPROFIL":45},"3":{"RISIKOPROFIL":45},"4":{"RISIKOPROFIL":45,"":1},"5":{"":1}}Łcfg<66>§neg_keyŔ

View File

@ -4,6 +4,8 @@
" ", " ",
" ", " ",
"\"", "\"",
"$",
"%",
"'", "'",
"''", "''",
"'-(", "'-(",
@ -46,6 +48,8 @@
")/\u00af", ")/\u00af",
"):", "):",
"*", "*",
"+",
",",
"-", "-",
"-((", "-((",
"-))", "-))",
@ -100,16 +104,40 @@
".\u00e4.", ".\u00e4.",
"/", "/",
"/3", "/3",
"/Core+",
"/Xxxx+",
"/core+",
"/d", "/d",
"/xxxx+",
"0", "0",
"0%+",
"0.0", "0.0",
"0.o", "0.o",
"022",
"032",
"034",
"0_0", "0_0",
"0_o", "0_o",
"1", "1",
"1.",
"10",
"12",
"2",
"2.",
"20",
"2022",
"2032",
"2034",
"250",
"3", "3",
"3.",
"33", "33",
"333", "333",
"35",
"5",
"50",
"7",
"7,50%+",
"8", "8",
"8)", "8)",
"8-", "8-",
@ -234,9 +262,20 @@
"Abt.", "Abt.",
"Abteilung", "Abteilung",
"Add", "Add",
"Aktueller",
"Allgemeine",
"Amsterdam",
"Anlagestrategien",
"Anlagevehikels",
"Ansprechpartners",
"Antagevehikels",
"Apr", "Apr",
"Apr.", "Apr.",
"April", "April",
"Art",
"Assets",
"Aufl\u00f6sung",
"Aufwertung",
"Aug", "Aug",
"Aug.", "Aug.",
"August", "August",
@ -250,6 +289,8 @@
"Bd", "Bd",
"Bd.", "Bd.",
"Beispiel", "Beispiel",
"Berlin",
"Bestandsentwicklungen",
"Betr", "Betr",
"Betr.", "Betr.",
"Betreff", "Betreff",
@ -271,6 +312,8 @@
"Chr.", "Chr.",
"Cie", "Cie",
"Cie.", "Cie.",
"Cities",
"Closings",
"Co", "Co",
"Co.", "Co.",
"Core", "Core",
@ -279,12 +322,15 @@
"D", "D",
"D.", "D.",
"D.C.", "D.C.",
"Deutschland",
"Deutschlands",
"Dez", "Dez",
"Dez.", "Dez.",
"Dezember", "Dezember",
"Di", "Di",
"Di.", "Di.",
"Dienstag", "Dienstag",
"Different",
"Dipl", "Dipl",
"Dipl.", "Dipl.",
"Dipl.-Ing", "Dipl.-Ing",
@ -294,9 +340,14 @@
"Donnerstag", "Donnerstag",
"Dr", "Dr",
"Dr.", "Dr.",
"D\u00e4nemark",
"E", "E",
"E-Mail",
"E.", "E.",
"Einw",
"Europe",
"European", "European",
"Exit",
"F", "F",
"F.", "F.",
"FIL", "FIL",
@ -310,20 +361,28 @@
"Februar", "Februar",
"Firma", "Firma",
"Fond", "Fond",
"Fonds",
"Fr", "Fr",
"Fr.", "Fr.",
"Frankreich",
"Frau", "Frau",
"Frl", "Frl",
"Frl.", "Frl.",
"Fr\u00e4ulein", "Fr\u00e4ulein",
"Fu\u0308hrende",
"G", "G",
"G.", "G.",
"G.m.b", "G.m.b",
"G.m.b.H.", "G.m.b.H.",
"Gateway",
"Gebr", "Gebr",
"Gebr.", "Gebr.",
"Geplantes",
"Gesamtrendite",
"H", "H",
"H.", "H.",
"Halten",
"Halten-Strategie",
"Hauptbahnhof", "Hauptbahnhof",
"Hbf", "Hbf",
"Hbf.", "Hbf.",
@ -343,13 +402,21 @@
"II.", "II.",
"III", "III",
"III.", "III.",
"INREV",
"IRR",
"IV", "IV",
"IV.", "IV.",
"Immobilien",
"Immobilien-Spezialfonds",
"Inc", "Inc",
"Inc.", "Inc.",
"Informationen",
"Ing", "Ing",
"Ing.", "Ing.",
"Investmentmanagers",
"J", "J",
"Jahr",
"Jahre",
"Jahrhundert", "Jahrhundert",
"Jan", "Jan",
"Jan.", "Jan.",
@ -369,16 +436,26 @@
"K", "K",
"K.", "K.",
"K.O.", "K.O.",
"Kaufen",
"Key",
"L", "L",
"L'", "L'",
"L.A.", "L.A.",
"LTV",
"LTY",
"Laufzeit",
"London",
"L\u00e4nderallokation",
"L\u2019", "L\u2019",
"M", "M",
"M.", "M.",
"M.A.", "M.A.",
"M.Sc", "M.Sc",
"M.Sc.", "M.Sc.",
"Manager",
"Maximaler",
"Mehrwertsteuer", "Mehrwertsteuer",
"Metropolregionen",
"Mi", "Mi",
"Mi.", "Mi.",
"Milliarde", "Milliarde",
@ -403,6 +480,9 @@
"N", "N",
"N.Y.", "N.Y.",
"N.Y.C.", "N.Y.C.",
"Nachvermietungsstrategie",
"Name",
"Niederlande",
"Nov", "Nov",
"Nov.", "Nov.",
"November", "November",
@ -416,14 +496,18 @@
"O.o", "O.o",
"O_O", "O_O",
"O_o", "O_o",
"Offen",
"Offener",
"Okt", "Okt",
"Okt.", "Okt.",
"Oktober", "Oktober",
"OpCo",
"Orig", "Orig",
"Orig.", "Orig.",
"Original", "Original",
"P", "P",
"P.S.", "P.S.",
"Paris",
"Pkt", "Pkt",
"Pkt.", "Pkt.",
"Prof", "Prof",
@ -434,32 +518,44 @@
"R.", "R.",
"R.I.P.", "R.I.P.",
"RE", "RE",
"REV",
"RISIKOPROFIL", "RISIKOPROFIL",
"ROOT", "ROOT",
"Rechtsform",
"Red", "Red",
"Red.", "Red.",
"Redaktion", "Redaktion",
"Risikoprofil",
"Risk",
"S", "S",
"S'", "S'",
"Sa", "Sa",
"Sa.", "Sa.",
"Samstag", "Samstag",
"Sc.", "Sc.",
"Schweden",
"Sep", "Sep",
"Sep.", "Sep.",
"Sept", "Sept",
"Sept.", "Sept.",
"September", "September",
"Sitz",
"Skandinavien",
"So", "So",
"So.", "So.",
"Sonntag", "Sonntag",
"St", "St",
"St.", "St.",
"Standortaufwertungsstrategie",
"Standorte",
"Std", "Std",
"Std.", "Std.",
"Stil",
"Str", "Str",
"Str.", "Str.",
"Strategie",
"Stra\u00dfe", "Stra\u00dfe",
"Struktur",
"Stunde", "Stunde",
"S\u2019", "S\u2019",
"T", "T",
@ -468,6 +564,7 @@
"Tel", "Tel",
"Tel.", "Tel.",
"Telefon", "Telefon",
"Telefonnummer",
"The", "The",
"Tr", "Tr",
"Tr.", "Tr.",
@ -488,8 +585,12 @@
"Value", "Value",
"Vol", "Vol",
"Vol.", "Vol.",
"W",
"Wertstabile",
"Wohnimmobilien",
"X'", "X'",
"X++", "X++",
"X-Xxxx",
"X.", "X.",
"X.X", "X.X",
"X.X.", "X.X.",
@ -518,13 +619,25 @@
"Xxxx", "Xxxx",
"Xxxx+", "Xxxx+",
"Xxxx+/Xxxxx", "Xxxx+/Xxxxx",
"Xxxx-XXX",
"Xxxx-Xxxxx-XXX",
"Xxxx.", "Xxxx.",
"Xxxx.-Xxx", "Xxxx.-Xxx",
"Xxxx.-Xxx.", "Xxxx.-Xxx.",
"Xxxxx", "Xxxxx",
"Xxxxx)/Xxxx",
"Xxxxx-Xxxxx",
"Xx\u0308xxxx",
"X\u2019", "X\u2019",
"Z", "Z",
"Z.", "Z.",
"Ziel-LTY",
"Ziel-Netto-IRR",
"Zielanlagestrategie",
"Zielregionfen)/Jand",
"Zielsektoren",
"Zielvolumen",
"Ziirraiaein",
"Zt", "Zt",
"Zt.", "Zt.",
"[", "[",
@ -578,21 +691,41 @@
"add", "add",
"adv", "adv",
"adv.", "adv.",
"ahr",
"ail",
"aiming",
"aktueller",
"al", "al",
"al.", "al.",
"allg", "allg",
"allg.", "allg.",
"allgemein", "allgemein",
"allgemeine",
"am.", "am.",
"ame",
"amsterdam",
"an.", "an.",
"and",
"anlagestrategien",
"anlagevehikels",
"ansprechpartners",
"antagevehikels",
"apr", "apr",
"apr.", "apr.",
"ark",
"art",
"asset",
"assets",
"at",
"at.", "at.",
"ath", "ath",
"auf", "auf",
"aufl\u00f6sung",
"aufwertung",
"auf\u2019m", "auf\u2019m",
"aug", "aug",
"aug.", "aug.",
"ausgew\u00e4hlte",
"ax.", "ax.",
"b", "b",
"b.", "b.",
@ -604,6 +737,8 @@
"bd.", "bd.",
"beispielsweise", "beispielsweise",
"ber", "ber",
"berlin",
"bestandsentwicklungen",
"betr", "betr",
"betr.", "betr.",
"beziehungsweise", "beziehungsweise",
@ -632,23 +767,29 @@
"c/o", "c/o",
"ca", "ca",
"ca.", "ca.",
"cal",
"cdu", "cdu",
"cdu/csu", "cdu/csu",
"ce>", "ce>",
"chr", "chr",
"chr.", "chr.",
"cht",
"cie", "cie",
"cie.", "cie.",
"cities",
"cl.", "cl.",
"closings",
"co", "co",
"co.", "co.",
"core", "core",
"core+", "core+",
"core+/value", "core+/value",
"csu", "csu",
"cts",
"d", "d",
"d'", "d'",
"d)", "d)",
"d,dd%+",
"d-", "d-",
"d-)", "d-)",
"d-X", "d-X",
@ -661,30 +802,43 @@
"dX", "dX",
"d_d", "d_d",
"d_x", "d_x",
"dam",
"dd", "dd",
"ddd", "ddd",
"dddd",
"de", "de",
"ded",
"dem", "dem",
"den",
"der",
"dergleichen", "dergleichen",
"des",
"deutschland",
"deutschlands",
"development",
"dez", "dez",
"dez.", "dez.",
"dgl", "dgl",
"dgl.", "dgl.",
"di", "di",
"di.", "di.",
"different",
"dipl", "dipl",
"dipl.", "dipl.",
"dipl.-ing", "dipl.-ing",
"dipl.-ing.", "dipl.-ing.",
"do", "do",
"do.", "do.",
"don",
"dr", "dr",
"dr.", "dr.",
"du", "du",
"du\u2019s", "du\u2019s",
"dv.", "dv.",
"d\u00e4nemark",
"d\u2019", "d\u2019",
"e", "e",
"e-mail",
"e.", "e.",
"e.V.", "e.V.",
"e.d", "e.d",
@ -699,6 +853,7 @@
"ebr", "ebr",
"ed.", "ed.",
"egr", "egr",
"egy",
"ehem", "ehem",
"ehem.", "ehem.",
"eigentlich", "eigentlich",
@ -708,12 +863,17 @@
"eine", "eine",
"einem", "einem",
"einen", "einen",
"einw",
"eit",
"el.", "el.",
"els",
"em.", "em.",
"en.", "en.",
"engl", "engl",
"engl.", "engl.",
"englisch", "englisch",
"enhancing",
"ent",
"entspr", "entspr",
"entspr.", "entspr.",
"ep.", "ep.",
@ -724,18 +884,23 @@
"erm.", "erm.",
"err", "err",
"ers", "ers",
"ersten",
"er\u2019s", "er\u2019s",
"es", "es",
"etc", "etc",
"etc.", "etc.",
"etr", "etr",
"ets",
"europe",
"european", "european",
"ev", "ev",
"ev.", "ev.",
"eventuell", "eventuell",
"evtl", "evtl",
"evtl.", "evtl.",
"exit",
"expertise", "expertise",
"exposure",
"ez.", "ez.",
"e\u2019s", "e\u2019s",
"f", "f",
@ -746,9 +911,14 @@
"fam.", "fam.",
"feb", "feb",
"feb.", "feb.",
"fen",
"festgelegter",
"fil",
"fond", "fond",
"fonds",
"fr", "fr",
"fr.", "fr.",
"frankreich",
"franz\u00f6sisch", "franz\u00f6sisch",
"frl", "frl",
"frl.", "frl.",
@ -756,11 +926,13 @@
"frz.", "frz.",
"fs.", "fs.",
"fund", "fund",
"fu\u0308hrende",
"f\u2019m", "f\u2019m",
"g", "g",
"g.", "g.",
"g.m.b", "g.m.b",
"g.m.b.h.", "g.m.b.h.",
"gateway",
"geb", "geb",
"geb.", "geb.",
"gebr", "gebr",
@ -772,6 +944,10 @@
"gegr\u00fcndet", "gegr\u00fcndet",
"gem", "gem",
"gem.", "gem.",
"gen",
"geplantes",
"ger",
"gesamtrendite",
"gf.", "gf.",
"gfs", "gfs",
"ggf", "ggf",
@ -780,6 +956,7 @@
"ggfs.", "ggfs.",
"gg\u00fc", "gg\u00fc",
"gg\u00fc.", "gg\u00fc.",
"gie",
"gl.", "gl.",
"good", "good",
"gr.", "gr.",
@ -789,9 +966,12 @@
"h.", "h.",
"h.c", "h.c",
"h.c.", "h.c.",
"halten",
"halten-strategie",
"hbf", "hbf",
"hbf.", "hbf.",
"hd.", "hd.",
"hed",
"hem", "hem",
"hf.", "hf.",
"hg", "hg",
@ -799,8 +979,10 @@
"hil", "hil",
"hinter", "hinter",
"hinter\u2019m", "hinter\u2019m",
"hotels",
"hr", "hr",
"hr.", "hr.",
"hre",
"hrn", "hrn",
"hrn.", "hrn.",
"hrsg", "hrsg",
@ -826,6 +1008,8 @@
"ich", "ich",
"ich\u2019s", "ich\u2019s",
"ie.", "ie.",
"ien",
"ies",
"ig.", "ig.",
"ihr", "ihr",
"ihr\u2019s", "ihr\u2019s",
@ -834,7 +1018,11 @@
"iii", "iii",
"iii.", "iii.",
"il.", "il.",
"ile",
"illustration", "illustration",
"ime",
"immobilien",
"immobilien-spezialfonds",
"in", "in",
"in.", "in.",
"inc", "inc",
@ -842,26 +1030,41 @@
"incl", "incl",
"incl.", "incl.",
"ind", "ind",
"ine",
"informationen",
"ing", "ing",
"ing.", "ing.",
"initiatives",
"inkl", "inkl",
"inkl.", "inkl.",
"inklusive", "inklusive",
"inrev",
"insb", "insb",
"insb.", "insb.",
"insbesondere", "insbesondere",
"investmentmanagers",
"investments", "investments",
"inw",
"io.", "io.",
"iol", "iol",
"ion", "ion",
"ipl", "ipl",
"irr",
"is", "is",
"ise", "ise",
"isk",
"iss", "iss",
"ite",
"ith",
"ity",
"itz",
"ium",
"iv", "iv",
"iv.", "iv.",
"j", "j",
"j.", "j.",
"jahr",
"jahre",
"jan", "jan",
"jan.", "jan.",
"jh", "jh",
@ -882,24 +1085,38 @@
"kath", "kath",
"kath.", "kath.",
"katholisch", "katholisch",
"kaufen",
"ket",
"key",
"kl.", "kl.",
"kt.", "kt.",
"l", "l",
"l'", "l'",
"l.", "l.",
"l.a.", "l.a.",
"langfristig",
"lat", "lat",
"lat.", "lat.",
"laufzeit",
"laut", "laut",
"le.g",
"ler",
"level",
"lg.", "lg.",
"lin",
"lio", "lio",
"llg", "llg",
"llt", "llt",
"llv", "llv",
"london",
"lt", "lt",
"lt.", "lt.",
"lte",
"ltv",
"lty",
"lue", "lue",
"lv.", "lv.",
"l\u00e4nderallokation",
"l\u2019", "l\u2019",
"m", "m",
"m.", "m.",
@ -911,19 +1128,30 @@
"m.m.", "m.m.",
"m.sc", "m.sc",
"m.sc.", "m.sc.",
"mal",
"management",
"manager",
"market",
"max", "max",
"max.", "max.",
"maximal", "maximal",
"maximaler",
"men",
"mer",
"metropolregionen",
"mi", "mi",
"mi.", "mi.",
"million",
"min", "min",
"min.", "min.",
"mind", "mind",
"mind.", "mind.",
"mindestens", "mindestens",
"minimal", "minimal",
"minor",
"mio", "mio",
"mio.", "mio.",
"mit",
"mo", "mo",
"mo.", "mo.",
"monatlich", "monatlich",
@ -946,18 +1174,26 @@
"n.r", "n.r",
"n.y.", "n.y.",
"n.y.c.", "n.y.c.",
"nachvermietungsstrategie",
"name",
"nat", "nat",
"nat.", "nat.",
"nc.", "nc.",
"ncl", "ncl",
"nd.", "nd.",
"nde",
"nds",
"ne", "ne",
"nem", "nem",
"nen", "nen",
"ner",
"ng.", "ng.",
"ngl", "ngl",
"ngs",
"niederlande",
"niv", "niv",
"nkl", "nkl",
"nor",
"nov", "nov",
"nov.", "nov.",
"nr", "nr",
@ -982,23 +1218,32 @@
"o_o", "o_o",
"of", "of",
"of.", "of.",
"offen",
"offener",
"og.", "og.",
"okt", "okt",
"okt.", "okt.",
"ol.", "ol.",
"ond", "ond",
"ood", "ood",
"opco",
"ope",
"ore", "ore",
"orig", "orig",
"orig.", "orig.",
"original", "original",
"orm",
"ov.", "ov.",
"over",
"p", "p",
"p.", "p.",
"p.a", "p.a",
"p.a.", "p.a.",
"p.s", "p.s",
"p.s.", "p.s.",
"pCo",
"paris",
"pco",
"pers", "pers",
"pers.", "pers.",
"phil", "phil",
@ -1008,26 +1253,35 @@
"pl.", "pl.",
"portfolio", "portfolio",
"pr.", "pr.",
"premium",
"prof", "prof",
"prof.", "prof.",
"profile",
"projects",
"pt.", "pt.",
"pw.", "pw.",
"q", "q",
"q.", "q.",
"q.e.d", "q.e.d",
"q.e.d.", "q.e.d.",
"quality",
"r", "r",
"r.", "r.",
"r.i.p.", "r.i.p.",
"rd.", "rd.",
"re", "re",
"re+", "re+",
"rechtsform",
"red", "red",
"red.", "red.",
"ren",
"rer", "rer",
"rer.", "rer.",
"rev",
"rig", "rig",
"ris",
"risikoprofil", "risikoprofil",
"risk",
"rl.", "rl.",
"rm.", "rm.",
"rn.", "rn.",
@ -1035,6 +1289,7 @@
"rr.", "rr.",
"rs.", "rs.",
"rsg", "rsg",
"rte",
"rz.", "rz.",
"r\u00f6m", "r\u00f6m",
"r\u00f6m.", "r\u00f6m.",
@ -1050,6 +1305,7 @@
"sa", "sa",
"sa.", "sa.",
"sb.", "sb.",
"schweden",
"sd.", "sd.",
"sen", "sen",
"sen.", "sen.",
@ -1057,10 +1313,13 @@
"sep.", "sep.",
"sept", "sept",
"sept.", "sept.",
"set",
"sf.", "sf.",
"sg.", "sg.",
"sie", "sie",
"sie\u2019s", "sie\u2019s",
"sitz",
"skandinavien",
"so", "so",
"so.", "so.",
"sog", "sog",
@ -1072,28 +1331,43 @@
"ss.", "ss.",
"st", "st",
"st.", "st.",
"standortaufwertungsstrategie",
"standorte",
"std", "std",
"std.", "std.",
"stellv", "stellv",
"stellv.", "stellv.",
"stil",
"str", "str",
"str.", "str.",
"strategie",
"strategy",
"struktur",
"sw.", "sw.",
"s\u2019", "s\u2019",
"t", "t",
"t.", "t.",
"tactical",
"tc.", "tc.",
"td.", "td.",
"tel", "tel",
"tel.", "tel.",
"telefonnummer",
"ten",
"ter", "ter",
"tes",
"th.", "th.",
"the", "the",
"tig",
"til",
"time",
"tl.", "tl.",
"to",
"tr", "tr",
"tr.", "tr.",
"tsd", "tsd",
"tsd.", "tsd.",
"tur",
"t\u00e4gl", "t\u00e4gl",
"t\u00e4gl.", "t\u00e4gl.",
"t\u00e4glich", "t\u00e4glich",
@ -1114,11 +1388,13 @@
"ul.", "ul.",
"un.", "un.",
"und", "und",
"ung",
"univ", "univ",
"univ.", "univ.",
"unter", "unter",
"unter\u2019m", "unter\u2019m",
"ur.", "ur.",
"ure",
"usf", "usf",
"usf.", "usf.",
"usw", "usw",
@ -1138,7 +1414,11 @@
"v.v", "v.v",
"v_v", "v_v",
"value", "value",
"value-added",
"vel",
"ver",
"vergleiche", "vergleiche",
"ves",
"vgl", "vgl",
"vgl.", "vgl.",
"vielleicht", "vielleicht",
@ -1149,6 +1429,7 @@
"vm.", "vm.",
"vol", "vol",
"vol.", "vol.",
"vom",
"vor", "vor",
"vor\u2019m", "vor\u2019m",
"vs", "vs",
@ -1157,12 +1438,18 @@
"w", "w",
"w.", "w.",
"wSt", "wSt",
"way",
"well-established",
"wertstabile",
"wir", "wir",
"wir\u2019s", "wir\u2019s",
"wiss", "wiss",
"wiss.", "wiss.",
"with",
"wohnimmobilien",
"x", "x",
"x'", "x'",
"x-xxxx",
"x.", "x.",
"x.X", "x.X",
"x.X.", "x.X.",
@ -1186,16 +1473,23 @@
"x_x", "x_x",
"xd", "xd",
"xdd", "xdd",
"xit",
"xx", "xx",
"xx.", "xx.",
"xx.x",
"xxx", "xxx",
"xxx.", "xxx.",
"xxxx", "xxxx",
"xxxx)/xxxx",
"xxxx+", "xxxx+",
"xxxx+/xxxx", "xxxx+/xxxx",
"xxxx-xxx",
"xxxx-xxxx",
"xxxx-xxxx-xxx",
"xxxx.", "xxxx.",
"xxxx\u2019x", "xxxx\u2019x",
"xxx\u2019x", "xxx\u2019x",
"xx\u0308xxxx",
"xx\u2019x", "xx\u2019x",
"x\u2019", "x\u2019",
"x\ufe35x", "x\ufe35x",
@ -1215,6 +1509,13 @@
"z.z.", "z.z.",
"z.zt.", "z.zt.",
"zgl", "zgl",
"ziel-lty",
"ziel-netto-irr",
"zielanlagestrategie",
"zielregionfen)/jand",
"zielsektoren",
"zielvolumen",
"ziirraiaein",
"zt", "zt",
"zw.", "zw.",
"zzgl", "zzgl",
@ -1236,6 +1537,8 @@
"\u00b0f.", "\u00b0f.",
"\u00b0k.", "\u00b0k.",
"\u00b0x.", "\u00b0x.",
"\u00dc",
"\u00dcbersicht",
"\u00e4", "\u00e4",
"\u00e4.", "\u00e4.",
"\u00e4gl", "\u00e4gl",
@ -1249,6 +1552,7 @@
"\u00fc", "\u00fc",
"\u00fc.", "\u00fc.",
"\u00fcber", "\u00fcber",
"\u00fcbersicht",
"\u00fcber\u2019m", "\u00fcber\u2019m",
"\u0ca0", "\u0ca0",
"\u0ca0_\u0ca0", "\u0ca0_\u0ca0",
@ -1269,6 +1573,8 @@
"\u2019xx", "\u2019xx",
"\u2019xxx", "\u2019xxx",
"\u2019\u2019", "\u2019\u2019",
"\u201a",
"\u20ac",
"\u2501", "\u2501",
"\u253b", "\u253b",
"\u253b\u2501\u253b", "\u253b\u2501\u253b",

View File

@ -46,7 +46,7 @@
"f":1.0 "f":1.0
} }
}, },
"tok2vec_loss":0.000000011, "tok2vec_loss":0.000000029,
"ner_loss":0.0000000457 "ner_loss":0.0000000614
} }
} }

View File

@ -1 +1 @@
ĄmovesŮx{"0":{},"1":{"RISIKOPROFIL":20},"2":{"RISIKOPROFIL":20},"3":{"RISIKOPROFIL":20},"4":{"RISIKOPROFIL":20,"":1},"5":{"":1}}Łcfg<66>§neg_keyŔ ĄmovesŮx{"0":{},"1":{"RISIKOPROFIL":45},"2":{"RISIKOPROFIL":45},"3":{"RISIKOPROFIL":45},"4":{"RISIKOPROFIL":45,"":1},"5":{"":1}}Łcfg<66>§neg_keyŔ

View File

@ -4,6 +4,8 @@
" ", " ",
" ", " ",
"\"", "\"",
"$",
"%",
"'", "'",
"''", "''",
"'-(", "'-(",
@ -46,6 +48,8 @@
")/\u00af", ")/\u00af",
"):", "):",
"*", "*",
"+",
",",
"-", "-",
"-((", "-((",
"-))", "-))",
@ -100,16 +104,40 @@
".\u00e4.", ".\u00e4.",
"/", "/",
"/3", "/3",
"/Core+",
"/Xxxx+",
"/core+",
"/d", "/d",
"/xxxx+",
"0", "0",
"0%+",
"0.0", "0.0",
"0.o", "0.o",
"022",
"032",
"034",
"0_0", "0_0",
"0_o", "0_o",
"1", "1",
"1.",
"10",
"12",
"2",
"2.",
"20",
"2022",
"2032",
"2034",
"250",
"3", "3",
"3.",
"33", "33",
"333", "333",
"35",
"5",
"50",
"7",
"7,50%+",
"8", "8",
"8)", "8)",
"8-", "8-",
@ -234,9 +262,20 @@
"Abt.", "Abt.",
"Abteilung", "Abteilung",
"Add", "Add",
"Aktueller",
"Allgemeine",
"Amsterdam",
"Anlagestrategien",
"Anlagevehikels",
"Ansprechpartners",
"Antagevehikels",
"Apr", "Apr",
"Apr.", "Apr.",
"April", "April",
"Art",
"Assets",
"Aufl\u00f6sung",
"Aufwertung",
"Aug", "Aug",
"Aug.", "Aug.",
"August", "August",
@ -250,6 +289,8 @@
"Bd", "Bd",
"Bd.", "Bd.",
"Beispiel", "Beispiel",
"Berlin",
"Bestandsentwicklungen",
"Betr", "Betr",
"Betr.", "Betr.",
"Betreff", "Betreff",
@ -271,6 +312,8 @@
"Chr.", "Chr.",
"Cie", "Cie",
"Cie.", "Cie.",
"Cities",
"Closings",
"Co", "Co",
"Co.", "Co.",
"Core", "Core",
@ -279,12 +322,15 @@
"D", "D",
"D.", "D.",
"D.C.", "D.C.",
"Deutschland",
"Deutschlands",
"Dez", "Dez",
"Dez.", "Dez.",
"Dezember", "Dezember",
"Di", "Di",
"Di.", "Di.",
"Dienstag", "Dienstag",
"Different",
"Dipl", "Dipl",
"Dipl.", "Dipl.",
"Dipl.-Ing", "Dipl.-Ing",
@ -294,9 +340,14 @@
"Donnerstag", "Donnerstag",
"Dr", "Dr",
"Dr.", "Dr.",
"D\u00e4nemark",
"E", "E",
"E-Mail",
"E.", "E.",
"Einw",
"Europe",
"European", "European",
"Exit",
"F", "F",
"F.", "F.",
"FIL", "FIL",
@ -310,20 +361,28 @@
"Februar", "Februar",
"Firma", "Firma",
"Fond", "Fond",
"Fonds",
"Fr", "Fr",
"Fr.", "Fr.",
"Frankreich",
"Frau", "Frau",
"Frl", "Frl",
"Frl.", "Frl.",
"Fr\u00e4ulein", "Fr\u00e4ulein",
"Fu\u0308hrende",
"G", "G",
"G.", "G.",
"G.m.b", "G.m.b",
"G.m.b.H.", "G.m.b.H.",
"Gateway",
"Gebr", "Gebr",
"Gebr.", "Gebr.",
"Geplantes",
"Gesamtrendite",
"H", "H",
"H.", "H.",
"Halten",
"Halten-Strategie",
"Hauptbahnhof", "Hauptbahnhof",
"Hbf", "Hbf",
"Hbf.", "Hbf.",
@ -343,13 +402,21 @@
"II.", "II.",
"III", "III",
"III.", "III.",
"INREV",
"IRR",
"IV", "IV",
"IV.", "IV.",
"Immobilien",
"Immobilien-Spezialfonds",
"Inc", "Inc",
"Inc.", "Inc.",
"Informationen",
"Ing", "Ing",
"Ing.", "Ing.",
"Investmentmanagers",
"J", "J",
"Jahr",
"Jahre",
"Jahrhundert", "Jahrhundert",
"Jan", "Jan",
"Jan.", "Jan.",
@ -369,16 +436,26 @@
"K", "K",
"K.", "K.",
"K.O.", "K.O.",
"Kaufen",
"Key",
"L", "L",
"L'", "L'",
"L.A.", "L.A.",
"LTV",
"LTY",
"Laufzeit",
"London",
"L\u00e4nderallokation",
"L\u2019", "L\u2019",
"M", "M",
"M.", "M.",
"M.A.", "M.A.",
"M.Sc", "M.Sc",
"M.Sc.", "M.Sc.",
"Manager",
"Maximaler",
"Mehrwertsteuer", "Mehrwertsteuer",
"Metropolregionen",
"Mi", "Mi",
"Mi.", "Mi.",
"Milliarde", "Milliarde",
@ -403,6 +480,9 @@
"N", "N",
"N.Y.", "N.Y.",
"N.Y.C.", "N.Y.C.",
"Nachvermietungsstrategie",
"Name",
"Niederlande",
"Nov", "Nov",
"Nov.", "Nov.",
"November", "November",
@ -416,14 +496,18 @@
"O.o", "O.o",
"O_O", "O_O",
"O_o", "O_o",
"Offen",
"Offener",
"Okt", "Okt",
"Okt.", "Okt.",
"Oktober", "Oktober",
"OpCo",
"Orig", "Orig",
"Orig.", "Orig.",
"Original", "Original",
"P", "P",
"P.S.", "P.S.",
"Paris",
"Pkt", "Pkt",
"Pkt.", "Pkt.",
"Prof", "Prof",
@ -434,32 +518,44 @@
"R.", "R.",
"R.I.P.", "R.I.P.",
"RE", "RE",
"REV",
"RISIKOPROFIL", "RISIKOPROFIL",
"ROOT", "ROOT",
"Rechtsform",
"Red", "Red",
"Red.", "Red.",
"Redaktion", "Redaktion",
"Risikoprofil",
"Risk",
"S", "S",
"S'", "S'",
"Sa", "Sa",
"Sa.", "Sa.",
"Samstag", "Samstag",
"Sc.", "Sc.",
"Schweden",
"Sep", "Sep",
"Sep.", "Sep.",
"Sept", "Sept",
"Sept.", "Sept.",
"September", "September",
"Sitz",
"Skandinavien",
"So", "So",
"So.", "So.",
"Sonntag", "Sonntag",
"St", "St",
"St.", "St.",
"Standortaufwertungsstrategie",
"Standorte",
"Std", "Std",
"Std.", "Std.",
"Stil",
"Str", "Str",
"Str.", "Str.",
"Strategie",
"Stra\u00dfe", "Stra\u00dfe",
"Struktur",
"Stunde", "Stunde",
"S\u2019", "S\u2019",
"T", "T",
@ -468,6 +564,7 @@
"Tel", "Tel",
"Tel.", "Tel.",
"Telefon", "Telefon",
"Telefonnummer",
"The", "The",
"Tr", "Tr",
"Tr.", "Tr.",
@ -488,8 +585,12 @@
"Value", "Value",
"Vol", "Vol",
"Vol.", "Vol.",
"W",
"Wertstabile",
"Wohnimmobilien",
"X'", "X'",
"X++", "X++",
"X-Xxxx",
"X.", "X.",
"X.X", "X.X",
"X.X.", "X.X.",
@ -518,13 +619,25 @@
"Xxxx", "Xxxx",
"Xxxx+", "Xxxx+",
"Xxxx+/Xxxxx", "Xxxx+/Xxxxx",
"Xxxx-XXX",
"Xxxx-Xxxxx-XXX",
"Xxxx.", "Xxxx.",
"Xxxx.-Xxx", "Xxxx.-Xxx",
"Xxxx.-Xxx.", "Xxxx.-Xxx.",
"Xxxxx", "Xxxxx",
"Xxxxx)/Xxxx",
"Xxxxx-Xxxxx",
"Xx\u0308xxxx",
"X\u2019", "X\u2019",
"Z", "Z",
"Z.", "Z.",
"Ziel-LTY",
"Ziel-Netto-IRR",
"Zielanlagestrategie",
"Zielregionfen)/Jand",
"Zielsektoren",
"Zielvolumen",
"Ziirraiaein",
"Zt", "Zt",
"Zt.", "Zt.",
"[", "[",
@ -578,21 +691,41 @@
"add", "add",
"adv", "adv",
"adv.", "adv.",
"ahr",
"ail",
"aiming",
"aktueller",
"al", "al",
"al.", "al.",
"allg", "allg",
"allg.", "allg.",
"allgemein", "allgemein",
"allgemeine",
"am.", "am.",
"ame",
"amsterdam",
"an.", "an.",
"and",
"anlagestrategien",
"anlagevehikels",
"ansprechpartners",
"antagevehikels",
"apr", "apr",
"apr.", "apr.",
"ark",
"art",
"asset",
"assets",
"at",
"at.", "at.",
"ath", "ath",
"auf", "auf",
"aufl\u00f6sung",
"aufwertung",
"auf\u2019m", "auf\u2019m",
"aug", "aug",
"aug.", "aug.",
"ausgew\u00e4hlte",
"ax.", "ax.",
"b", "b",
"b.", "b.",
@ -604,6 +737,8 @@
"bd.", "bd.",
"beispielsweise", "beispielsweise",
"ber", "ber",
"berlin",
"bestandsentwicklungen",
"betr", "betr",
"betr.", "betr.",
"beziehungsweise", "beziehungsweise",
@ -632,23 +767,29 @@
"c/o", "c/o",
"ca", "ca",
"ca.", "ca.",
"cal",
"cdu", "cdu",
"cdu/csu", "cdu/csu",
"ce>", "ce>",
"chr", "chr",
"chr.", "chr.",
"cht",
"cie", "cie",
"cie.", "cie.",
"cities",
"cl.", "cl.",
"closings",
"co", "co",
"co.", "co.",
"core", "core",
"core+", "core+",
"core+/value", "core+/value",
"csu", "csu",
"cts",
"d", "d",
"d'", "d'",
"d)", "d)",
"d,dd%+",
"d-", "d-",
"d-)", "d-)",
"d-X", "d-X",
@ -661,30 +802,43 @@
"dX", "dX",
"d_d", "d_d",
"d_x", "d_x",
"dam",
"dd", "dd",
"ddd", "ddd",
"dddd",
"de", "de",
"ded",
"dem", "dem",
"den",
"der",
"dergleichen", "dergleichen",
"des",
"deutschland",
"deutschlands",
"development",
"dez", "dez",
"dez.", "dez.",
"dgl", "dgl",
"dgl.", "dgl.",
"di", "di",
"di.", "di.",
"different",
"dipl", "dipl",
"dipl.", "dipl.",
"dipl.-ing", "dipl.-ing",
"dipl.-ing.", "dipl.-ing.",
"do", "do",
"do.", "do.",
"don",
"dr", "dr",
"dr.", "dr.",
"du", "du",
"du\u2019s", "du\u2019s",
"dv.", "dv.",
"d\u00e4nemark",
"d\u2019", "d\u2019",
"e", "e",
"e-mail",
"e.", "e.",
"e.V.", "e.V.",
"e.d", "e.d",
@ -699,6 +853,7 @@
"ebr", "ebr",
"ed.", "ed.",
"egr", "egr",
"egy",
"ehem", "ehem",
"ehem.", "ehem.",
"eigentlich", "eigentlich",
@ -708,12 +863,17 @@
"eine", "eine",
"einem", "einem",
"einen", "einen",
"einw",
"eit",
"el.", "el.",
"els",
"em.", "em.",
"en.", "en.",
"engl", "engl",
"engl.", "engl.",
"englisch", "englisch",
"enhancing",
"ent",
"entspr", "entspr",
"entspr.", "entspr.",
"ep.", "ep.",
@ -724,18 +884,23 @@
"erm.", "erm.",
"err", "err",
"ers", "ers",
"ersten",
"er\u2019s", "er\u2019s",
"es", "es",
"etc", "etc",
"etc.", "etc.",
"etr", "etr",
"ets",
"europe",
"european", "european",
"ev", "ev",
"ev.", "ev.",
"eventuell", "eventuell",
"evtl", "evtl",
"evtl.", "evtl.",
"exit",
"expertise", "expertise",
"exposure",
"ez.", "ez.",
"e\u2019s", "e\u2019s",
"f", "f",
@ -746,9 +911,14 @@
"fam.", "fam.",
"feb", "feb",
"feb.", "feb.",
"fen",
"festgelegter",
"fil",
"fond", "fond",
"fonds",
"fr", "fr",
"fr.", "fr.",
"frankreich",
"franz\u00f6sisch", "franz\u00f6sisch",
"frl", "frl",
"frl.", "frl.",
@ -756,11 +926,13 @@
"frz.", "frz.",
"fs.", "fs.",
"fund", "fund",
"fu\u0308hrende",
"f\u2019m", "f\u2019m",
"g", "g",
"g.", "g.",
"g.m.b", "g.m.b",
"g.m.b.h.", "g.m.b.h.",
"gateway",
"geb", "geb",
"geb.", "geb.",
"gebr", "gebr",
@ -772,6 +944,10 @@
"gegr\u00fcndet", "gegr\u00fcndet",
"gem", "gem",
"gem.", "gem.",
"gen",
"geplantes",
"ger",
"gesamtrendite",
"gf.", "gf.",
"gfs", "gfs",
"ggf", "ggf",
@ -780,6 +956,7 @@
"ggfs.", "ggfs.",
"gg\u00fc", "gg\u00fc",
"gg\u00fc.", "gg\u00fc.",
"gie",
"gl.", "gl.",
"good", "good",
"gr.", "gr.",
@ -789,9 +966,12 @@
"h.", "h.",
"h.c", "h.c",
"h.c.", "h.c.",
"halten",
"halten-strategie",
"hbf", "hbf",
"hbf.", "hbf.",
"hd.", "hd.",
"hed",
"hem", "hem",
"hf.", "hf.",
"hg", "hg",
@ -799,8 +979,10 @@
"hil", "hil",
"hinter", "hinter",
"hinter\u2019m", "hinter\u2019m",
"hotels",
"hr", "hr",
"hr.", "hr.",
"hre",
"hrn", "hrn",
"hrn.", "hrn.",
"hrsg", "hrsg",
@ -826,6 +1008,8 @@
"ich", "ich",
"ich\u2019s", "ich\u2019s",
"ie.", "ie.",
"ien",
"ies",
"ig.", "ig.",
"ihr", "ihr",
"ihr\u2019s", "ihr\u2019s",
@ -834,7 +1018,11 @@
"iii", "iii",
"iii.", "iii.",
"il.", "il.",
"ile",
"illustration", "illustration",
"ime",
"immobilien",
"immobilien-spezialfonds",
"in", "in",
"in.", "in.",
"inc", "inc",
@ -842,26 +1030,41 @@
"incl", "incl",
"incl.", "incl.",
"ind", "ind",
"ine",
"informationen",
"ing", "ing",
"ing.", "ing.",
"initiatives",
"inkl", "inkl",
"inkl.", "inkl.",
"inklusive", "inklusive",
"inrev",
"insb", "insb",
"insb.", "insb.",
"insbesondere", "insbesondere",
"investmentmanagers",
"investments", "investments",
"inw",
"io.", "io.",
"iol", "iol",
"ion", "ion",
"ipl", "ipl",
"irr",
"is", "is",
"ise", "ise",
"isk",
"iss", "iss",
"ite",
"ith",
"ity",
"itz",
"ium",
"iv", "iv",
"iv.", "iv.",
"j", "j",
"j.", "j.",
"jahr",
"jahre",
"jan", "jan",
"jan.", "jan.",
"jh", "jh",
@ -882,24 +1085,38 @@
"kath", "kath",
"kath.", "kath.",
"katholisch", "katholisch",
"kaufen",
"ket",
"key",
"kl.", "kl.",
"kt.", "kt.",
"l", "l",
"l'", "l'",
"l.", "l.",
"l.a.", "l.a.",
"langfristig",
"lat", "lat",
"lat.", "lat.",
"laufzeit",
"laut", "laut",
"le.g",
"ler",
"level",
"lg.", "lg.",
"lin",
"lio", "lio",
"llg", "llg",
"llt", "llt",
"llv", "llv",
"london",
"lt", "lt",
"lt.", "lt.",
"lte",
"ltv",
"lty",
"lue", "lue",
"lv.", "lv.",
"l\u00e4nderallokation",
"l\u2019", "l\u2019",
"m", "m",
"m.", "m.",
@ -911,19 +1128,30 @@
"m.m.", "m.m.",
"m.sc", "m.sc",
"m.sc.", "m.sc.",
"mal",
"management",
"manager",
"market",
"max", "max",
"max.", "max.",
"maximal", "maximal",
"maximaler",
"men",
"mer",
"metropolregionen",
"mi", "mi",
"mi.", "mi.",
"million",
"min", "min",
"min.", "min.",
"mind", "mind",
"mind.", "mind.",
"mindestens", "mindestens",
"minimal", "minimal",
"minor",
"mio", "mio",
"mio.", "mio.",
"mit",
"mo", "mo",
"mo.", "mo.",
"monatlich", "monatlich",
@ -946,18 +1174,26 @@
"n.r", "n.r",
"n.y.", "n.y.",
"n.y.c.", "n.y.c.",
"nachvermietungsstrategie",
"name",
"nat", "nat",
"nat.", "nat.",
"nc.", "nc.",
"ncl", "ncl",
"nd.", "nd.",
"nde",
"nds",
"ne", "ne",
"nem", "nem",
"nen", "nen",
"ner",
"ng.", "ng.",
"ngl", "ngl",
"ngs",
"niederlande",
"niv", "niv",
"nkl", "nkl",
"nor",
"nov", "nov",
"nov.", "nov.",
"nr", "nr",
@ -982,23 +1218,32 @@
"o_o", "o_o",
"of", "of",
"of.", "of.",
"offen",
"offener",
"og.", "og.",
"okt", "okt",
"okt.", "okt.",
"ol.", "ol.",
"ond", "ond",
"ood", "ood",
"opco",
"ope",
"ore", "ore",
"orig", "orig",
"orig.", "orig.",
"original", "original",
"orm",
"ov.", "ov.",
"over",
"p", "p",
"p.", "p.",
"p.a", "p.a",
"p.a.", "p.a.",
"p.s", "p.s",
"p.s.", "p.s.",
"pCo",
"paris",
"pco",
"pers", "pers",
"pers.", "pers.",
"phil", "phil",
@ -1008,26 +1253,35 @@
"pl.", "pl.",
"portfolio", "portfolio",
"pr.", "pr.",
"premium",
"prof", "prof",
"prof.", "prof.",
"profile",
"projects",
"pt.", "pt.",
"pw.", "pw.",
"q", "q",
"q.", "q.",
"q.e.d", "q.e.d",
"q.e.d.", "q.e.d.",
"quality",
"r", "r",
"r.", "r.",
"r.i.p.", "r.i.p.",
"rd.", "rd.",
"re", "re",
"re+", "re+",
"rechtsform",
"red", "red",
"red.", "red.",
"ren",
"rer", "rer",
"rer.", "rer.",
"rev",
"rig", "rig",
"ris",
"risikoprofil", "risikoprofil",
"risk",
"rl.", "rl.",
"rm.", "rm.",
"rn.", "rn.",
@ -1035,6 +1289,7 @@
"rr.", "rr.",
"rs.", "rs.",
"rsg", "rsg",
"rte",
"rz.", "rz.",
"r\u00f6m", "r\u00f6m",
"r\u00f6m.", "r\u00f6m.",
@ -1050,6 +1305,7 @@
"sa", "sa",
"sa.", "sa.",
"sb.", "sb.",
"schweden",
"sd.", "sd.",
"sen", "sen",
"sen.", "sen.",
@ -1057,10 +1313,13 @@
"sep.", "sep.",
"sept", "sept",
"sept.", "sept.",
"set",
"sf.", "sf.",
"sg.", "sg.",
"sie", "sie",
"sie\u2019s", "sie\u2019s",
"sitz",
"skandinavien",
"so", "so",
"so.", "so.",
"sog", "sog",
@ -1072,28 +1331,43 @@
"ss.", "ss.",
"st", "st",
"st.", "st.",
"standortaufwertungsstrategie",
"standorte",
"std", "std",
"std.", "std.",
"stellv", "stellv",
"stellv.", "stellv.",
"stil",
"str", "str",
"str.", "str.",
"strategie",
"strategy",
"struktur",
"sw.", "sw.",
"s\u2019", "s\u2019",
"t", "t",
"t.", "t.",
"tactical",
"tc.", "tc.",
"td.", "td.",
"tel", "tel",
"tel.", "tel.",
"telefonnummer",
"ten",
"ter", "ter",
"tes",
"th.", "th.",
"the", "the",
"tig",
"til",
"time",
"tl.", "tl.",
"to",
"tr", "tr",
"tr.", "tr.",
"tsd", "tsd",
"tsd.", "tsd.",
"tur",
"t\u00e4gl", "t\u00e4gl",
"t\u00e4gl.", "t\u00e4gl.",
"t\u00e4glich", "t\u00e4glich",
@ -1114,11 +1388,13 @@
"ul.", "ul.",
"un.", "un.",
"und", "und",
"ung",
"univ", "univ",
"univ.", "univ.",
"unter", "unter",
"unter\u2019m", "unter\u2019m",
"ur.", "ur.",
"ure",
"usf", "usf",
"usf.", "usf.",
"usw", "usw",
@ -1138,7 +1414,11 @@
"v.v", "v.v",
"v_v", "v_v",
"value", "value",
"value-added",
"vel",
"ver",
"vergleiche", "vergleiche",
"ves",
"vgl", "vgl",
"vgl.", "vgl.",
"vielleicht", "vielleicht",
@ -1149,6 +1429,7 @@
"vm.", "vm.",
"vol", "vol",
"vol.", "vol.",
"vom",
"vor", "vor",
"vor\u2019m", "vor\u2019m",
"vs", "vs",
@ -1157,12 +1438,18 @@
"w", "w",
"w.", "w.",
"wSt", "wSt",
"way",
"well-established",
"wertstabile",
"wir", "wir",
"wir\u2019s", "wir\u2019s",
"wiss", "wiss",
"wiss.", "wiss.",
"with",
"wohnimmobilien",
"x", "x",
"x'", "x'",
"x-xxxx",
"x.", "x.",
"x.X", "x.X",
"x.X.", "x.X.",
@ -1186,16 +1473,23 @@
"x_x", "x_x",
"xd", "xd",
"xdd", "xdd",
"xit",
"xx", "xx",
"xx.", "xx.",
"xx.x",
"xxx", "xxx",
"xxx.", "xxx.",
"xxxx", "xxxx",
"xxxx)/xxxx",
"xxxx+", "xxxx+",
"xxxx+/xxxx", "xxxx+/xxxx",
"xxxx-xxx",
"xxxx-xxxx",
"xxxx-xxxx-xxx",
"xxxx.", "xxxx.",
"xxxx\u2019x", "xxxx\u2019x",
"xxx\u2019x", "xxx\u2019x",
"xx\u0308xxxx",
"xx\u2019x", "xx\u2019x",
"x\u2019", "x\u2019",
"x\ufe35x", "x\ufe35x",
@ -1215,6 +1509,13 @@
"z.z.", "z.z.",
"z.zt.", "z.zt.",
"zgl", "zgl",
"ziel-lty",
"ziel-netto-irr",
"zielanlagestrategie",
"zielregionfen)/jand",
"zielsektoren",
"zielvolumen",
"ziirraiaein",
"zt", "zt",
"zw.", "zw.",
"zzgl", "zzgl",
@ -1236,6 +1537,8 @@
"\u00b0f.", "\u00b0f.",
"\u00b0k.", "\u00b0k.",
"\u00b0x.", "\u00b0x.",
"\u00dc",
"\u00dcbersicht",
"\u00e4", "\u00e4",
"\u00e4.", "\u00e4.",
"\u00e4gl", "\u00e4gl",
@ -1249,6 +1552,7 @@
"\u00fc", "\u00fc",
"\u00fc.", "\u00fc.",
"\u00fcber", "\u00fcber",
"\u00fcbersicht",
"\u00fcber\u2019m", "\u00fcber\u2019m",
"\u0ca0", "\u0ca0",
"\u0ca0_\u0ca0", "\u0ca0_\u0ca0",
@ -1269,6 +1573,8 @@
"\u2019xx", "\u2019xx",
"\u2019xxx", "\u2019xxx",
"\u2019\u2019", "\u2019\u2019",
"\u201a",
"\u20ac",
"\u2501", "\u2501",
"\u253b", "\u253b",
"\u253b\u2501\u253b", "\u253b\u2501\u253b",

View File

@ -4,7 +4,7 @@ import json
from pathlib import Path from pathlib import Path
nlp = spacy.load("output/model-last") nlp = spacy.load("output/model-last")
input_pdf = Path("../../pitch-books/Pitchbook 1.pdf") input_pdf = Path("../ocr/output/Pitchbook 1-OCR.pdf")
doc = fitz.open(input_pdf) doc = fitz.open(input_pdf)

View File

@ -1,26 +1,66 @@
TRAINING_DATA = [ TRAINING_DATA = [
( (
"Core",{"entities":[[0,4,"RISIKOPROFIL"]]}, "Core",
{"entities":[[0,4,"RISIKOPROFIL"]]},
), ),
( (
"Core+",{"entities":[[0,5,"RISIKOPROFIL"]]}, "Core+",
{"entities":[[0,5,"RISIKOPROFIL"]]},
), ),
( (
"Core/Core+",{"entities":[[0,10,"RISIKOPROFIL"]]}, "Core/Core+",
{"entities":[[0,10,"RISIKOPROFIL"]]},
), ),
( (
"Value Add",{"entities":[[0,9,"RISIKOPROFIL"]]}, "Value Add",
{"entities":[[0,9,"RISIKOPROFIL"]]},
), ),
( (
"Core/Value Add",{"entities":[[0,14,"RISIKOPROFIL"]]}, "Core/Value Add",
{"entities":[[0,14,"RISIKOPROFIL"]]},
), ),
( (
"Core+/Value Add",{"entities":[[0,15,"RISIKOPROFIL"]]}, "Core+/Value Add",
{"entities":[[0,15,"RISIKOPROFIL"]]},
), ),
( (
"Core/Core+/Value Add",{"entities":[[0,20,"RISIKOPROFIL"]]}, "Core/Core+/Value Add",
{"entities":[[0,20,"RISIKOPROFIL"]]},
), ),
( (
"The RE portfolio of the fund is a good illustration of Fond expertise in European core/core+ investments .",{"entities":[[82,92,"RISIKOPROFIL"]]}, "The RE portfolio of the fund is a good illustration of Fond expertise in European core/core+ investments .",
{"entities":[[82,92,"RISIKOPROFIL"]]},
), ),
(
"Risk level: Core/Core+",
{"entities":[[12,22,"RISIKOPROFIL"]]},
),
(
"Different risk profile (core, core+, value-added)",
{"entities":[[24,48,"RISIKOPROFIL"]]},
),
(
"Core/Core+ with OpCo premium",
{"entities":[[0,10,"RISIKOPROFIL"]]},
),
(
"Core /Core+ Assets, well-established = Key Gateway Cities in Europe le.g. hotels in the market with minor asset London, Paris, Amsterdam, Berlin] management initiatives",
{"entities":[[0,11,"RISIKOPROFIL"]]},
),
(
"Risikoprofil: Core, Core +",
{"entities":[[14,26,"RISIKOPROFIL"]]},
),
(
"Name des Fonds Name des Investmentmanagers Allgemeine Informationen Name des Ansprechpartners Telefonnummer des Ansprechpartners E-Mail des Ansprechpartners Art des Anlagevehikels Struktur des Anlagevehikels Sitz des Anlagevehikels Struktur des Antagevehikels vom Manager festgelegter Stil Rechtsform Jahr des ersten Closings Laufzeit Geplantes Jahr der Auflösung Ziel-Netto-IRR / Gesamtrendite* Zielvolumen des Anlagevehikels Ziel-LTY Aktueller LTV Ziirraiaein Maximaler LTV Zielregionfen)/Jand Zielsektoren Zielanlagestrategie INREV Fonds Offen Deutschland Core, Core + Offener Immobilien-Spezialfonds 2022 10 - 12 Jahre 2032 - 2034 7,50%+ 250 Mio. € 20% 0% 20% Führende Metropolregionen Deutschlands und ausgewählte Standorte >50T Einw. Wohnimmobilien Wertstabile Wohnimmobilien (mit Bestandsentwicklungen)",
{"entities":[[560,572,"RISIKOPROFIL"]]},
),
(
"Core/Core+ strategy, with tactical exposure to development projects aiming at enhancing the quality of the portfolio over time",
{"entities":[[0,10,"RISIKOPROFIL"]]},
),
(
"Strategie - Übersicht Risikoprofil Core+ Halten-Strategie Kaufen — Halten (langfristig) — Exit 1. Nachvermietungsstrategie Anlagestrategien 2. Standortaufwertungsstrategie 3. Strategie der Aufwertung der Immobilien Niederlande (max. 35 %) Länderallokation Frankreich (max. 35 %) (in % vom Zielvolumen) Skandinavien (Schweden, Dänemark) (max. 35 %) Deutschland (<= 10 %)",
{"entities":[[35,40,"RISIKOPROFIL"]]},
)
] ]