Véges szavak általánosított részszó-bonyolultsága

Hasonló dokumentumok
On The Number Of Slim Semimodular Lattices

Gráfelméleti feladatok. c f

Alternating Permutations

Construction of a cube given with its centre and a sideline

Mapping Sequencing Reads to a Reference Genome

Using the CW-Net in a user defined IP network

Bevezetés a kvantum-informatikába és kommunikációba 2015/2016 tavasz

Correlation & Linear Regression in SPSS

Dependency preservation

Word and Polygon List for Obtuse Triangular Billiards II

ACTA ACADEMIAE PAEDAGOGICAE AGRIENSIS

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

SQL/PSM kurzorok rész

Statistical Inference

A logaritmikus legkisebb négyzetek módszerének karakterizációi

I/A. Az alkalmazottak adatai

Széchenyi István Egyetem

Relative Clauses Alárendelő mellékmondat

A Magyar Nemzeti Bank elnökének 19/2012. (X. 4.) MNB rendelete

Create & validate a signature

Lecture 11: Genetic Algorithms

Erdős-Ko-Rado theorems on the weak Bruhat lattice

hatályos:

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

Basic Arrays. Contents. Chris Wild & Steven Zeil. May 28, Description 3

First experiences with Gd fuel assemblies in. Tamás Parkó, Botond Beliczai AER Symposium

PELL EGYENLETEK MEGOLDÁSA LINEÁRIS REKURZÍV SOROZATOK SEGÍTSÉGÉVEL

A próbafelvételi eredményei: (Minden feladat 5 pontos volt...)

Adatbázisok 1. Rekurzió a Datalogban és SQL-99

16F628A megszakítás kezelése

discosnp demo - Peterlongo Pierre 1 DISCOSNP++: Live demo

6647. Csanytelek, Volentér János tér 2.sz. 63/ ; fax: 63/ ; honlap:

Cluster Analysis. Potyó László

KIEGÉSZÍTŽ FELADATOK. Készlet Bud. Kap. Pápa Sopr. Veszp. Kecsk Pécs Szomb Igény

Iktatószám: 33-2/2013/KIK/01

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Publikációs lista. Vásárhelyi Bálint Márk

Célterület adatlap. Szolgáltatáscsomag: azonos tevékenység, téma köré szerveződő szolgáltatások összekapcsolt halmaza.

Számítógéppel irányított rendszerek elmélete. Gyakorlat - Mintavételezés, DT-LTI rendszermodellek

Személyes adatváltoztatási formanyomtatvány- Magyarország / Personal Data Change Form - Hungary

Nemzetközi Kenguru Matematikatábor

Csatlakozás a BME eduroam hálózatához Setting up the BUTE eduroam network

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

.../2007. (...) Korm. rendelete. az építésüggyel kapcsolatos egyes kormányrendeletek módosításáról

FÖLDRAJZ ANGOL NYELVEN GEOGRAPHY

Kvantum-informatika és kommunikáció 2015/2016 ősz. A kvantuminformatika jelölésrendszere szeptember 11.

BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI

(NGB_TA024_1) MÉRÉSI JEGYZŐKÖNYV

Ültetési és öntözési javaslatok. Planting and watering instructions

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Correlation & Linear Regression in SPSS

ELŐTERJESZTÉS A Képviselő-testület május 16-i ülésére

Computer Architecture

Többszörösen élesen tranzitív halmazok véges csoportokban

5.441 eft bg) térségi fejlesztési tanácstól az államháztartás központi alrendszerén belülről kapott EU-s forrásból származó pénzeszközből,

LIST OF PUBLICATIONS

Tudományos Ismeretterjesztő Társulat

212/2010. (VII. 1.) Korm. rendelet. az egyes miniszterek, valamint a Miniszterelnökséget vezető államtitkár feladat- és hatásköréről (KIVONAT)

Vállalati kockázatkezelés jelentősége

Pletykaalapú gépi tanulás teljesen elosztott környezetben

KELER KSZF Zrt. bankgarancia-befogadási kondíciói. Hatályos: július 8.

Ensemble Kalman Filters Part 1: The basics

Aktuális adózási és szabályozási kérdések a turizmusban 2012-es adóváltozások Személyi jövedelemadó

Can/be able to. Using Can in Present, Past, and Future. A Can jelen, múlt és jövő idejű használata

THS710A, THS720A, THS730A & THS720P TekScope Reference

MATEMATIKA ANGOL NYELVEN

Datalog: logikai alapú lekérdezı nyelv

Tudományos Ismeretterjesztő Társulat

Genome 373: Hidden Markov Models I. Doug Fowler

Célterület adatlap. I. Fogalom magyarázat. II. Támogatás vehető igénybe. III. Támogatás mértéke. növelése

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

Utasítások. Excel VII. Visual Basic programozás alapok. A Visual Basic-kel megoldható feladatok típusai Objektumok, változók Alprogramok

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

Supporting Information

KN-CP50. MANUAL (p. 2) Digital compass. ANLEITUNG (s. 4) Digitaler Kompass. GEBRUIKSAANWIJZING (p. 10) Digitaal kompas

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Hypothesis Testing. Petra Petrovics.

Cashback 2015 Deposit Promotion teljes szabályzat

Számítógéppel irányított rendszerek elmélete. A rendszer- és irányításelmélet legfontosabb részterületei. Hangos Katalin. Budapest

Személyes adatváltoztatási formanyomtatvány - Magyarország / Personal Data Change Form - Hungary

MATEMATIKA ANGOL NYELVEN

A MaCS konferencia első tizenöt éve

T Á J É K O Z T A T Ó. A 1108INT számú nyomtatvány a webcímen a Letöltések Nyomtatványkitöltő programok fülön érhető el.

I. fejezet ÁLTALÁNOS RENDELKEZÉSEK. 1. Debrecen Megyei Jogú Város Polgármesteri Hivatala jogállása és alapadatai

Société Réaliste / Ocular Braces

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon

Centre Fédéré en Vérication

Rekurzió a Datalogban és az SQL3-ban

Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka

There is/are/were/was/will be

Csima Judit május 10.

MAGYAR KÖZLÖNY 167. szám

MATEMATIKA ANGOL NYELVEN

2. Local communities involved in landscape architecture in Óbuda

Combinatorics, Paul Erd}os is Eighty (Volume 2) Keszthely (Hungary), 1993, pp. 1{46. Dedicated to the marvelous random walk

a védelmi feladatokban részt vevő elektronikus hírközlési szolgáltatók kijelöléséről és felkészülési feladataik meghatározásáról

STUDENT LOGBOOK. 1 week general practice course for the 6 th year medical students SEMMELWEIS EGYETEM. Name of the student:

Klaszterezés, 2. rész

Characterizations and Properties of Graphs of Baire Functions

IRÁNYÍTOTT GRÁFOK FOKHALMAZAI IVÁNYI ANTAL, MATUSZKA TAMÁS, NÉMETH ZSOLT (MÁJUS 14)

Előszó.2. Starter exercises. 3. Exercises for kids.. 9. Our comic...17

Átírás:

Véges szavak általánosított részszó-bonyolultsága KÁSA Zoltán Sapientia Erdélyi Magyar Tudományegyetem Kolozsvár Marosvásárhely Csíkszereda Matematika-Informatika Tanszék, Marosvásárhely Budapest, 2010. szept. 9 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 1 / 30

Értelmezések Értelmezés Legyenek n, d 1, d 2 és s pozitív egész számok, és u = x 1 x 2... x n Σ n egy Σ ábécé feletti szó. A v = x i1 x i2... x is szó, ahol i 1 1, d 1 i j+1 i j d 2, ha j = 1, 2,..., s 1, i s n, az u szó s hosszúságú (d 1, d 2 )-részszava. Például, az aabcade szóban a (2, 4)-részszavak: a, ab, ac, aba, aa, acd, abd, aae, abae, ace, abe, ad, b, ba, bd, bae, be, c, cd, ce, ae, d, e. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 2 / 30

Értelmezés Egy adott szó összes, egymástól különböző (d 1, d 2 )-részszavának számát az adott szó (d 1, d 2 )-bonyolultságának nevezzük. d 1 = 1 A. Iványi, On the d-complexity of words, Annales Univ. Sci. Budapest., Sect. Computatorica, 8 (1987) 69 90. Z. Kása, On the d-complexity of strings, Pure Math. Appl., 9, 1 2 (1998) 119 128. d 2 = n 1 Z. Kása, Super-d-complexity of finite words, 8th MaCs, Komárno, July 14 17, 2010. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 3 / 30

Definitions Let Σ be an alphabet, Σ n the set of all n-length words over Σ, Σ the set of all finite word over Σ. Definition Let n, d and s be positive integers, and u = x 1 x 2... x n Σ n. A d-subword of length s of u is defined as v = x i1 x i2... x is where i 1 1, 1 i j+1 i j d for j = 1, 2,..., s 1, i s n. u = bear 2-subwords: b, e, a, r be, ba, ea, er, ar bea, ber, bar, ear bear Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 4 / 30

Definition Let n, d and s be positive integers, and u = x 1 x 2... x n Σ n. A super-d-subword of length s of u is defined as v = x i1 x i2... x is where i 1 1, d i j+1 i j < n for j = 1, 2,..., s 1, i s n. u= abcdef super-2-subwords: a, ac, ad, ae, af, ace, acf, adf, b, bd, be, bf, bdf, c, ce, cf, d, df, e, f Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 5 / 30

Definition The super-d-complexity of a word is the number of all its different super-d-subwords. u= abcdef super-2-subwords: a, ac, ad, ae, af, ace, acf, adf, b, bd, be, bf, bdf, c, ce, cf, d, df, e, f The super-2-complexity of this word is 20. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 6 / 30

Super-d-complexity of rainbow words Words with different letters are called rainbow words. The super-d-complexity of an n-length rainbow word: S(n, d). Let us denote by b n,d (i) the number of super-d-subwords which begin in the position i in an n-length rainbow word. u=abcdef b 6,2 (1) = 8: a, ac, ad, ae, af, ace, acf, adf b 6,2 (2) = 5, b 6,2 (3) = 3, b 6,2 (4) = 2, b 6,2 (5) = 1, b 6,2 (6) = 1. b n,d (i) = 1 + b n,d (i +d) + b n,d (i +d +1) + + b n,d (n), for n > d, 1 i n d, b n,d (1) = 1 for n d. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 7 / 30

The super-d-complexity of rainbow words can be computed by the formula: S(n, d) = This can be expressed also as n b n,d (i). i=1 n S(n, d) = b k,d (1), k=1 because of the formula S(n + 1, d) = S(n, d) + b n+1,d (1). In the case d = 1 the complexity S(n, 1) can be computed easily: S(n, 1) = 2 n 1. This is equal to the n-complexity of n-length rainbow words. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 8 / 30

Computing super-d-complexity of rainbow words by recursive algorithms by mathematical formulas by graph algorithms Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 9 / 30

Computing super-d-complexity by recursive algorithms for k 1 to n do b k 1 B(n, d, i) 1 1 1 1 1 1 1 1 B(n, d, i) 1 p 1 2 for k i + d to n 3 do if b k = 1 4 then B(n, d, k) 5 p p + b k 6 b i p 7 return B(8, 2, 1): b 7 = 1, b 8 = 1, b 5 = 3, b 6 = 2, b 3 = 8, b 4 = 5, b 1 = 21. 21 1 8 5 3 2 1 1 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 10 / 30

Lemma b n,2 (1) = F n, where F n is the nth Fibonacci number. Theorem S(n, 2) = F n+2 1, where F n is the nth Fibonacci number. Let us denote by M n,d = b n,d (1), M n,d = M n 1,d + M n d,d, for n d 2, M 0,d = 0, M 1,d = 1,..., M d 1,d = 1. Let us name this sequence d-middle sequence. Because of the M n,2 = F n equality, the d-middle sequence can be considered as a generalization of the Fibonacci sequence. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 11 / 30

The next algorithm computes M n,d, by using an array M 0, M 1,..., M d 1 to store the necessary previous elements: MIDDLE(n, d) 1 M 0 0 2 for i 1 to d 1 3 do M i 1 4 for i d to n 5 do M i mod d M (i 1) mod d + M (i d) mod d 6 print M i mod d 7 return Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 12 / 30

Using the generating function M d (z) = n 0 M n,d z n, the following closed formula results: M d (z) = z 1 z z d. This can be used to compute the sum s n,d = n M i,d, which is the n=1 coefficient of z n+d in the expansion of the function z d 1 z z d 1 1 z = z d 1 z z d + z 1 z z d z 1 z. So s n.d = M n+(d 1),d + M n,d 1 = M n+d,d 1. Therefore n M i,d = M n+d,d 1. i=1 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 13 / 30

Theorem S(n, d) = M n+d,d 1, where n > d and M n,d is the nth elements of d-middle sequence. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 14 / 30

Computing super-d-complexity by mathematical formulas Theorem S(n, d) = k 0 ( n (d 1)k k + 1 ), for n 2, d 1. Theorem b n+1,d (1) = k 0 ( n (d 1)k k ), for n 1, d 1. ( ) n (d 1)k = k + 1 k 0 and from this n ( i 1 (d 1)k k i=1 k 0 n ( ) ( ) i 1 (d 1)k n (d 1)k = k k + 1 i=1 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 15 / 30 ),

Latin négyzet L = a b d c 0 ab 0 ad ba 0 0 bd ca cb 0 cd 0 0 dc 0 L = 0 b 0 d a 0 0 d a b 0 d 0 0 c 0 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 16 / 30

L (2) = L (3) = L (4) = 0 0 adc abd 0 0 bdc bad { } cad cba cab 0 cbd dca dcb 0 0 0 adcb abdc 0 bdca 0 badc 0 { } cbad 0 0 0 cabd dcba dcab 0 0 { } adcba 0 0 0 abdca { } bdcab 0 0 0 badcb { } cbadc 0 0 0 cabdc 0 0 0 { dcbad dcabd } Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 17 / 30

Az L 3 elemei szerint a gráfban 8 Hamilton-út van, L 4 szerint pedig két Hamilton-kör (a mátixban ezek mindegyike négyszer jelenik meg, hisz egy kör bármelyik csúccsal kezdődhet). a b d c adcba, abdca Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 18 / 30

Computing super-d-complexity by graph algorithms G = (V, E), with V = { a 1, a 2,..., a n }, E = { (a i, a j ) j i d, i = 1, 2,..., n, j = 1, 2,..., n }. a b c d e f Graph for super-2-subwords when n = 6. The adjacency matrix A = ( a ij ) a ij = { 1, if j i d, 0, otherwise, i=1,n j=1,n of the graph is defined by: for i = 1, 2,..., n, j = 1, 2,..., n. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 19 / 30

R = I + A + A 2 + + A k, where A k+1 = O (the null matrix). The super-d-complexity of a rainbow word is then n n S(n, d) = r ij. i=1 j=1 Matrix R can be better computed using a variant of the well-known Warshall algorithm: WARSHALL(A, n) 1 W A 2 for k 1 to n 3 do for i 1 to n 4 do for j 1 to n 5 do w ij w ij + w ik w kj 6 return W From W we obtain easily R = I + W. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 20 / 30

A = After applying the Warshall algorithm: W = 0 0 1 1 2 3 0 0 0 1 1 2 0 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 1 1 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0, R = and then S(6, 2) = 20, the sum of elements in R. 1 0 1 1 2 3 0 1 0 1 1 2 0 0 1 0 1 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 1 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 21 / 30

The Warshall algorithm combined with the Latin square method can be used to obtain all nontrivial (with length at least 2) super-d-subwords of a given n-length rainbow word a 1 a 2 a n. Let us consider a matrix A with the elements A ij which are set of strings. Initially this matrix is defined as: A ij = { {ai a j }, if j i d,, otherwise, for i = 1, 2,..., n, j = 1, 2,..., n. If A and B are sets of strings, AB will be formed by the set of concatenation of each string from A with each string from B: AB = { ab a A, b B }. If s = s 1 s 2 s p is a string, let us denote by s the string obtained from s by eliminating the first character: s = s 2 s 3 s p. Let us denote by A ij the set A ij in which we eliminate from each element the first character. In this case A is a matrix with elements A ij. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 22 / 30

Starting with the matrix A defined as before, the algorithm to obtain all nontrivial super-d-subwords is the following: WARSHALL-LATIN(A, n) 1 W A 2 for k 1 to n 3 do for i 1 to n 4 do for j 1 to n 5 do if W ik and W kj 6 then W ij W ij W ik W kj 7 return W The set of nontrivial super-d-subwords is i,j {1,2,...,n} W ij. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 23 / 30

For n = 8, d = 3 the initial matrix is: {ad} {ae} {af } {ag} {ah} {be} {bf } {bg} {bh} {cf } {cg} {ch} {dg} {dh} {eh}. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 24 / 30

The result of the algorithm in this case is: {ad} {ae} {af } {ag, adg} {ah, adh, aeh} {be} {bf } {bg} {bh, beh} {cf } {cg} {ch} {dg} {dh} {eh}. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 25 / 30

The general case In the general case for any word w Σ, let us denote the super-d-complexity by S w (d). We have w S w (d) S( w, d), d where w is the length of w. The minimal value is obtained for a trivial word w = a... a, and the maximal one for a rainbow word. The algorithm WARSHALL-LATIN can be used for nonrainbow words too, with the remark that repeating subwords must be eliminated. For the word aabbbaaa and d = 3 the result is: aa, ab, aba, ba. (nontrivial subwords only) Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 26 / 30

w S w (2) 00000 3 00001 5 00010 5 00011 5 00100 6 00101 6 00110 6 00111 5 01000 5 01001 7 01010 7 01011 6 01100 6 01101 7 01110 7 01111 5 Max S w (2) is 7. Let us denote by f (m, n, d) the maximal value of the super-d-complexity of all words of length n over an alphabet of m letters: f (m, n, d) = max w Σ n m = Σ ( ) S w (d). Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 27 / 30

2 3 4 5 6 7 8 9 10 7 14 7 6 5 3 - - - - 8 19 10 6 6 5 3 - - - 9 26 13 7 6 6 5 3 - - 10 35 15 10 6 6 6 5 3-11 47 19 13 7 6 6 6 5 3 Theorem f (2, n, n 1) = 3 for n 3. f (2, n, n 2) = 5 for n 4. n If d n 3 then f (2, n, d) = 6 for n 6. 2 ( If n is even, then f 2, n, n 2 ) = 10 for n 6. 2 ( If n is odd, then f 2, n, n 1 ) = 7 for n 5. 2 Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 28 / 30

f (2, n, 2) = f (2, n 1, 2) + f (2, n 2, 2) f (2, n 4, 2) for n 7. Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 29 / 30

W. Ebeling, R. Feistel, Physik der Selbstorganisation und Evolution, Akademie-Verlag, Berlin, 1982. C. Elzinga, S. Rahmann, H. Wung, Algorithms for subsequence combinatorics, Theor. Comput. Sci., 409, 3 (2008) 394 404. C. H. Elzinga, Complexity of categorial time series, Sociological Methods & Research, 38, 3 (2010) 463 481. http://home.fsw.vu.nl/ch.elzinga/complexity%20preliminary.pdf O. G. Troyanskaya, O. Arbell, Y. Koren, G. M. Landau, A. Bolshoy, Sequence complexity profiles of prokaryotic genomic sequences: A fast algorithm for calculating linguistic complexity, Bioinformatics, 18, 5 (2002) 679 688. N. J. A. Sloane, The on-line encyclopedia of integer sequences, http://www.research.att.com/ njas/sequences/ Kása Z. (EMTE) Általánosított részszó-bonyolultság Budapest, 2010. szept. 9 30 / 30